OpenAI将在ChatGPT推出新的语音和图像功能

7,129次阅读
没有评论

共计 903 个字符,预计需要花费 3 分钟才能阅读完成。

OpenAI 将在 ChatGPT 推出新的语音和图像功能,几秒钟制作出逼真的合成语音,

OpenAI 于官网宣布将在 ChatGPT 中推出新的语音和图像功能,允许用户进行语音对话、上传图像。

主要值得关注的点包括:

用户现在可以与 ChatGPT 进行语音交谈, 它可以回复你。这个新功能由文本转语音模型提供支持, 可以从文本和少量语音样本生成逼真的语音。

用户现在可以在 ChatGPT 中展示一张或多张图像, 以获取相关帮助和见解。在移动应用上, 可以使用绘图工具聚焦图像的特定部分。这些视觉能力由多模态 GPT-3.5 和 GPT- 4 提供支持。

OpenAI 正逐步推出这些新功能, 以进行改进和风险缓解, 并准备用户使用更强大的系统。考虑到语音和视觉能力带来的新风险, 这种渐进策略尤为重要。

其中,官方给出了一些可能的应用场景:

当旅行时, 拍下一处地标的图片, 并就其有趣之处进行语音交谈。

在家时, 拍下冰箱和食品柜的图片, 弄清做什么晚餐(并提出后续问题获取步骤式食谱)。

晚餐后, 通过拍照、圈画题目, 并与孩子共享提示, 帮助孩子解决数学问题。

也包括视频中的案例,指导用户选择正确的工具调节自行车座椅的高度。

据 OpenAI 官网 9 月 25 日消息,OpenAI 宣布在接下来的两周内,将在 ChatGPT 中向 Plus 和 Enterprise 用户推出语音和图像。语音将在 iOS 和 Android 上推出(在您的设置中选择加入),图像将在所有平台上提供。

看到人工智能不断地进化,不少人的焦虑始终存在,进入到这个时代已经很难有什么工作是永恒不被替换的贴饭碗了, 人工智能很显然在不久的未来将替代绝大部分现有的工作, 如果你不想被淘汰那就拥抱人工智能吧, 关注他, 学习他, 使用他。

人工智能将会被应用到生活的方方面面,而这个过程你会计算机编程技术你就有一定的优势,虽然你不一定去喂数据,调模型,不过你却可以调接口,提高你的生产力和你所在企业的生产力。

W3Cschool 编程狮 是你很好的编程入门老师,这里有很多免费的教程和文档,可以帮助你快速入门和实践,当然如果你有马内,还有很多不错的视频,微课等形式的内容帮助你快速学习掌握。

原文地址: OpenAI 将在 ChatGPT 推出新的语音和图像功能

    正文完
     0
    Yojack
    版权声明:本篇文章由 Yojack 于2024-09-20发表,共计903字。
    转载说明:
    1 本网站名称:优杰开发笔记
    2 本站永久网址:https://yojack.cn
    3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长进行删除处理。
    4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
    5 本站所有内容均可转载及分享, 但请注明出处
    6 我们始终尊重原创作者的版权,所有文章在发布时,均尽可能注明出处与作者。
    7 站长邮箱:laylwenl@gmail.com
    评论(没有评论)