OpenAI新模型是什么?能即时翻译对话,3大亮点一次看

美国人工智慧研究实验室OpenAI在5/13举办线上发表会,由OpenAI的技术总监米拉穆拉蒂(Mira Murati)主持,推出新模型。GPT-4o的来自全能模型,能接受文字、声音和图像3种格式的输入,最快更能够在232毫秒内回应,等同人类反应时间。最重要的是,拉穆拉蒂也宣布GPT-4o将免费提供给所有用户。

GPT-4o亮点|1. 拟真对话还能算数学

GPT-4o平均反应时间是320毫秒,最快则可在232毫秒内回应,与人类的对话反应时间相似,因此使用者与GPT-4o对话时,无需等待延迟时间就能获得即时回答。反应时间缩短,GPT-4o能够以更自然、就像人类的声音进行互动,也能模仿机器人的语气,或模拟人类说睡前故事,甚至也会唱歌。除了语音技术提升外,也进化视觉化技术,透过镜头能带着使用者一步一步解开数学题。

GPT-4o亮点|2.感测使用者情绪

GPT-3.5与GPT-4,是以三个独立的模型构成与使用者的对话,第一个模型将音讯转换为文字,第二个模型输出成文字,最后一个模型将文字转换回音讯,这样繁琐的过程会让GPT无法观察到语调及情感等等。因此OpenAI特别在GPT-4o模型上进行调整,输入和输出都由同一神经网路处理后,能感测到使用者的,即使是对话过程中打岔GPT-4o,它也能迅速接上。

GPT-4o亮点|3.即时翻译语言

GPT-4o语音技术的提升,不只在反应速度与情绪感知,更能够即时翻译语言。在发表会上,米拉穆拉蒂与多模态与尖端研究部门主管Mark Chen分别以义大利文和英文交谈,GPT-4o迅速将内容翻译成双方各自的语言,展示强大的即时翻译能力。


GPT-4o亮点|4.所有用户免费

米拉穆拉蒂宣布GPT-4o模型将开放所有用户免费使用,针对付费用户则有5倍的容量上限,而预计未来几周推出的GPT-4o alpha版,具有新版语音模式,将提供给ChatGPT Plus用户。原先只有ChatGPT Plus用户能使用的,也在GPT-4o免费开放后,同步免费。除此之外,Mac用户也有桌面版ChatGPT App可以使用, Windows用户的版本则将在今年推出。

延伸阅读:

【V V Vision数位潮】妳的ChatGPT无法通灵,别过度依赖AI!Threads加入NBA即时赛况更新!搜寻球队就能掌握比分,关注赛事零时差Threads是什么?怎么用?10大功能懒人包,年轻Z世代爱用的文字版IG

关于作者: 网站小编

HIS时尚网,引领前沿时尚生活。传递最新时尚资讯,解读潮流美妆趋势,剖析奢品选购指南,引领前沿生活方式。

热门文章