搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
技术学习(版主发帖区)
›
大模型
›
总结型
›
ChatGPT扔出王炸:将其打造成微信好友,可以语音聊天, ...
0
0
0
分享
ChatGPT扔出王炸:将其打造成微信好友,可以语音聊天,讨论图像
nettman
2023-9-26 08:18:05
发表于
总结型
[显示全部楼层]
只看大图
阅读模式
关闭右栏
0
758
本帖最后由 nettman 于 2023-9-26 20:44 编辑
ChatGPT一直宣称可以上传图片、语音功能,如今他已经不在是传说,终于对外开放。
如果只是单纯的功能添加,其实还不够震撼。根据官网介绍,显然他们的初衷是想把ChatGPT当作我们的微信好友一样。可以和它语音聊天、讨论图片。
下面是官网介绍:
我们开始在 ChatGPT 中推出新的语音和图像功能。它们提供了一种新的、更直观的界面,允许您进行语音对话或向 ChatGPT 显示正在谈论的内容。
生活场景,像(
微信
)好友一样陪伴
语音和图像提供更多在生活中使用 ChatGPT 的方式。在旅行时拍摄地标的照片,并实时讨论其中的有趣之处。当回到家时,拍下冰箱和食品储藏室的照片,以了解晚餐吃什么(并询问后续问题以获取逐步食谱)。晚餐后,通过拍照、圈出问题集并让它与你们俩分享提示来帮助您的孩子解决数学问题。
我们将在接下来的两周内向 Plus 和 Enterprise 用户推出 ChatGPT 中的语音和图像。
语音将在 iOS 和 Android 上提供(在您的设置中选择加入),并且图像将在所有平台上提供
。
与 ChatGPT 交谈并让它回复
现在可以使用语音与助手进行来回对话。随时随地与它交谈,为家人请求睡前故事,或解决餐桌上的争论。
如何开启语音功能
要开始使用语音,请前往移动应用程序上的“设置”→“新功能”,然后选择加入语音对话。然后,点击主屏幕右上角的耳机按钮,从五种不同的声音中选择喜欢的声音。
语音可以定制
新的语音功能由新的文本转语音模型提供支持,能够仅从文本和几秒钟的样本语音中生成类似人类的音频。我们与专业配音演员合作创作了每一个声音。我们还使用我们的开源语音识别系统 Whisper 将您的口语转录为文本。
谈论图像
可以向 ChatGPT 显示一张或多张图像。排查烧烤炉无法启动的原因,探索冰箱中的物品来计划膳食,或分析复杂的图表以获取与工作相关的数据。要关注图像的特定部分,可以使用我们移动应用程序中的绘图工具。
显示 ChatGPT 一张或多张图像。
首先,点击照片按钮来拍摄或选择图像。如果使用的是 iOS 或 Android,请先点击加号按钮。还可以讨论多个图像或使用我们的绘图工具来指导您的助手。
图像理解由多模态 GPT-3.5 和 GPT-4 提供支持。这些模型将其语言推理技能应用于各种图像,例如照片、屏幕截图以及包含文本和图像的文档。
我们正在逐步部署图像和语音能力
OpenAI 的目标是构建安全且有益的 AGI。我们相信逐步提供我们的工具,这使我们能够随着时间的推移进行改进和完善风险缓解措施,同时也让每个人为未来更强大的系统做好准备。对于涉及语音和视觉的高级模型,这一策略变得更加重要。
嗓音
新的语音技术能够从短短几秒钟的真实语音中生成逼真的合成语音,为许多创造性和以可访问性为重点的应用程序打开了大门。然而,这些功能也带来了新的风险,例如恶意行为者可能冒充公众人物或实施欺诈。
这就是我们使用这项技术来支持特定用例(语音聊天)的原因。语音聊天是与我们直接合作的配音演员创建的。我们也以类似的方式与其他人合作。例如,Spotify 正在利用这项技术的力量来试点其语音翻译功能,该功能可以通过播客自己的声音将播客翻译成其他语言,从而帮助播客扩大讲故事的范围。
图像输入
基于视觉的模型也提出了新的挑战,从对人的幻觉到依赖模型对高风险领域图像的解释。在更广泛的部署之前,我们与红队成员一起测试了该模型在极端主义和科学能力等领域的风险,以及一组不同的阿尔法测试人员。我们的研究使我们能够调整一些关键细节,以实现负责任的使用。
让视觉既有用又安全
与其他 ChatGPT 功能一样,Vision 旨在为日常生活提供帮助。当它能看到你所看到的东西时,它会做得最好。
这种方法是通过我们与 Be My Eyes 的合作直接获得的,Be My Eyes 是一款为盲人和弱视人士提供的免费移动应用程序,旨在了解用途和限制。用户告诉我们,他们发现就背景中恰好包含人物的图像进行一般性对话很有价值,例如当您试图弄清楚遥控器设置时有人出现在电视上
我们还采取了技术措施来显着限制 ChatGPT 分析和直接发表有关人员的陈述的能力,因为 ChatGPT 并不总是准确的,并且这些系统应该尊重个人的隐私。
现实世界的使用和反馈将帮助我们更好地完善这些保障措施,同时保持该工具的有用性。
模型限制的透明度
用户可能依赖 ChatGPT 来获取专业主题,例如研究等领域。我们对该模型的局限性保持透明,并且在没有适当验证的情况下不鼓励高风险用例。此外,
该模型擅长转录英语文本,但在其他一些语言(尤其是非罗马文字的语言)中表现不佳。我们建议非英语用户不要将 ChatGPT 用于此目的。
ChatGPT将扩大访问范围
Plus 和 Enterprise 用户将在接下来的两周内体验语音和图像。
最新经典文章,欢迎关注公众号
-----------我的底线--------------
中文版ChatGPT
https://xing.aboutyun.com/
获取更多资源:
领取100本书+1T资源
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26480
大数据5个项目视频
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25235
名企资源、名企面试题、最新BAT面试题、专题面试题等资源汇总
https://www.aboutyun.com/forum.php?mod=viewthread&tid=27732
加微信w3aboutyun,可拉入技术爱好者群
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
没找到任何评论,期待你打破沉寂
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
nettman
超级版主
关注
2911
主题
3204
帖子
478
粉丝
TA的主题
谷歌版o1模型发布
2024-12-20
避坑大厂基础架构
2024-11-26
Flink CDC:新一代实时数据集成框架
2024-11-26
蚂蚁面试就是不一样
2024-11-26
招聘1万人
2024-11-21
24小时热文
矩阵分析引论罗家洪(第四版)
互联网大厂年终福利曝光:看看别人家老板怎
像高手一样发言:七种常见工作场景的说话之
携程允许员工春节回乡办公2个月
数据治理实施方案
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈