برای انجام این گزارشگری، هر فریم ویدیو از طریق API به مدل GPT-4 Vision داده شده تا اون رو توصیف کنه. در قدم بعدی متن خروجی GPT-4 به مدل تبدیل متن به صدای OpenAI داده شده تا این متن رو با صدای طبیعی به عنوان گزارشگر تبدیل کنه.
اخبار داغ و حواشی حوزه ورزش را از دست ندهید! به صفحه جدیدترین اخبار ورزشی مراجعه کنید.