分享

4个令人惊艳的ChatGPT项目,开源了!AIGC也太猛了



一、Visual ChatGPT
这个是微软开源的项目,一周多的时间,就斩获了 23.6k+ star。

简单概括它,那就是一个多模态的问答系统。

支持AI绘画、语言问答、看图问答,将 AI 届近期的 3 大热点集于一身。

系统实现框架如下:



1.jpg

这是一个“大力出奇迹”的开源项目,集多方研究成果于一身:BLIP、CLIP、ChatGPT、pix2pix、inpainting、vqa 等。

说白了,就是教你怎样使用这些项目,搭建一个多模态的问答系统,这个系统架构很有参考价值。


项目地址:

https://github.com/microsoft/visual-chatgpt

二、SadTalker
这是一篇 2023 年的 CVPR 论文对应的开源项目。

刚刚开源,新鲜热乎~


1.png

功能就是:根据一张图片、一段音频,合成面部说这段语音的视频。

结合 ChatGPT、AIGC、音频文字转换,虚拟二次元 or 三次元形象,就能“活”过来了。


1.png

此外,还项目还做成了 stable diffusion webui 的插件,也就是直接能在 stable diffusion 里使用。


1.jpg

生成的图片,直接配合一段音频,就能生成合成的视频。
https://github.com/winfredy/sadtalker


三、FateZero
文本能编辑生成图片?那视频能编辑吗?

FateZero:我可以!

左图是原图,右图是生成效果,输入的文本是:

增加 Pokémon 动漫风格

1.jpg

增加水墨画风格:


1.jpg

除了视频的风格迁移,也支持修改里面的内容。

比如:松鼠吃胡萝卜,变成,兔子吃茄子。


1.jpg

这个项目也是基于sd做的,离一键生成视频,又进了一步。

https://github.com/chenyangqiqi/fatezero


四、ChatPaper
arXiv 想必大家都知道,当下最流行的论文托管网站,上面有来自世界各地的科学家、研究学者。

为了提高 arXiv 用户阅读论文的效率,有人开源了一款利用 ChatGPT 总结 arXiv 论文的开源工具 ChatPaper。


1.jpg

开发者的动机,他是这样讲述的:


1.jpg

简而言之,该项目可根据用户关键词下载 arXiv 上的最新论文,利用 ChatGPT3.5 API 强大的归纳能力,将其浓缩成固定格式,文字少且易读。

同时,项目支持个人自己部署,或者直接去 Hugge Face 体验。


https://github.com/kaixindelele/ChatPaper

ChatGPT免费交流,可拉入交流群:




获取更多资源:
领取100本书+1T资源
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26480

大数据5个项目视频
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25235

名企资源、名企面试题、最新BAT面试题、专题面试题等资源汇总
https://www.aboutyun.com/forum.php?mod=viewthread&tid=27732
加微信w3aboutyun,可拉入技术爱好者群

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条