OpenAI将在ChatGPT推出新的语音和图像功能

7,129次阅读

没有评论

共计 903 个字符，预计需要花费 3 分钟才能阅读完成。

OpenAI 于官网宣布将在 ChatGPT 中推出新的语音和图像功能，允许用户进行语音对话、上传图像。

主要值得关注的点包括:

用户现在可以与 ChatGPT 进行语音交谈, 它可以回复你。这个新功能由文本转语音模型提供支持, 可以从文本和少量语音样本生成逼真的语音。

用户现在可以在 ChatGPT 中展示一张或多张图像, 以获取相关帮助和见解。在移动应用上, 可以使用绘图工具聚焦图像的特定部分。这些视觉能力由多模态 GPT-3.5 和 GPT- 4 提供支持。

OpenAI 正逐步推出这些新功能, 以进行改进和风险缓解, 并准备用户使用更强大的系统。考虑到语音和视觉能力带来的新风险, 这种渐进策略尤为重要。

其中，官方给出了一些可能的应用场景：

当旅行时, 拍下一处地标的图片, 并就其有趣之处进行语音交谈。

在家时, 拍下冰箱和食品柜的图片, 弄清做什么晚餐(并提出后续问题获取步骤式食谱)。

晚餐后, 通过拍照、圈画题目, 并与孩子共享提示, 帮助孩子解决数学问题。

也包括视频中的案例，指导用户选择正确的工具调节自行车座椅的高度。

据 OpenAI 官网 9 月 25 日消息，OpenAI 宣布在接下来的两周内，将在 ChatGPT 中向 Plus 和 Enterprise 用户推出语音和图像。语音将在 iOS 和 Android 上推出（在您的设置中选择加入），图像将在所有平台上提供。

看到人工智能不断地进化，不少人的焦虑始终存在，进入到这个时代已经很难有什么工作是永恒不被替换的贴饭碗了, 人工智能很显然在不久的未来将替代绝大部分现有的工作, 如果你不想被淘汰那就拥抱人工智能吧, 关注他, 学习他, 使用他。

人工智能将会被应用到生活的方方面面，而这个过程你会计算机编程技术你就有一定的优势，虽然你不一定去喂数据，调模型，不过你却可以调接口，提高你的生产力和你所在企业的生产力。

W3Cschool 编程狮是你很好的编程入门老师，这里有很多免费的教程和文档，可以帮助你快速入门和实践，当然如果你有马内，还有很多不错的视频，微课等形式的内容帮助你快速学习掌握。

原文地址: OpenAI 将在 ChatGPT 推出新的语音和图像功能

正文完

HTML

发表至：开发笔记

2024-09-20

0

转载说明：

1 本网站名称：优杰开发笔记
2 本站永久网址：https://yojack.cn
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站所有内容均可转载及分享, 但请注明出处
6 我们始终尊重原创作者的版权，所有文章在发布时，均尽可能注明出处与作者。
7 站长邮箱：laylwenl@gmail.com

Vue3 setup TypeScript: 构建现代、类型安全的Vue应用的关键技巧总结

学习python选择哪本书好？python入门书籍推荐！

jquery.min.js:2 Uncaught TypeError: Failed to execute ‘createLinearGradient‘ on ‘CanvasRenderingCont

前端JS特效第31波：jQuery图片上传展示插件imgFileupload.js

JavaScript 中 Reflect 的作用是什么？