首页 行业研究 正文

计算机行业点评:GPT4展望:多模态 CHATGPT下一站

扫码手机浏览

GPT4 有望于2023 年发布。根据《财富》杂志报道,OpenAI 还有更多创新蓄势待发,OpenAI 在贝塔测试版GPT-4 中采用了更强大的大语言模型,预计该版本将于今年甚至很快发布。关于GPT4 的猜测众说纷纭,尘嚣甚上,且公开...

机构:国盛证券有限责任公司

作者:刘高畅

GPT4 有望于2023 年发布。根据《财富》杂志报道,OpenAI 还有更多创新蓄势待发,OpenAI 在贝塔测试版GPT-4 中采用了更强大的大语言模型,预计该版本将于今年甚至很快发布。关于GPT4 的猜测众说纷纭,尘嚣甚上,且公开信息较为有限,我们在此总结各路信息、展望未来,供各位投资者参考:
相较前代,GPT4 可能不会有参数量上的巨幅提升,而是在其他方向寻求提高。
在2023 年1 月18 日的一场公开采访中,当OpenAI 的CEO Sam Altman 被问及一张在推特上被疯转的图时(该图称GPT-3 拥有1750 亿参数,而GPT-4 可能拥有100 万亿参数),Altman 称其“完全是胡说”。这证明了即将到来的GPT4可能不会往一味巨幅扩大参数量的方向去走,而可能向其他方向寻求提升。
GPT4 有可能是一个多模态模型,可用于图像等领域。根据The Seattle Times 新闻报道,GPT4 可能是一个很像ChatGPT 的系统,只生成文本;或者它也可以把图像和文字结合起来。一些风投机构和微软员工已经看到了它的运行情况,但是OpenAI 还没有确定新系统是否会发布涉及图像的功能。此外,根据财富杂志报道,OpenAI 也确实在开发一款通过文字能生成视频的AI 模型。
若GPT4 转向多模态,未来输入输出可能出现图像、视频等形态,有望打开下游千行百业应用空间。NLP 只是大模型的应用领域之一,未来大模型的输入输出可以不仅限于文字,虽然当前影响力最强的ChatGPT 是NLP 模型,还可以包括图像、视频等多种形式,成为多模态模型,例如OpenAI 的绘画AI 模型DALL-E2,在AIGC 界引起过巨大反响的Stable Diffusion 等等。
传统的CNN 演绎下视觉应用解决问题都是单点模式,CHATGPT 多模态有望带来通用模式。传统CNN 模式下,视觉AI 公司倾向于采用单点方式,在各个碎片场景中做客制化落地,定制化程度相对较高;若转向大模型模式,GPT4 的多模态能力有望带来通用化的模式,显著提升AI 模型生产效率。例如,商汤科技的SenseCore AI 大装置中,模型层的模型工厂可以大幅降低人工智能生产要素的成本,提高人工智能的生产效率,实现人工智能以自动化、自适应的方式进行生产和落地,模型工厂已开发超过49000 个商用人工智能模型。我们认为,若GPT4转向多模态,图像、视频等应用将层出不穷涌现。其使用场景将远远不仅限于文字、问答与办公,打开有望未来AI 在下游千行百业的应用空间,进一步打开市场想象力。
投资建议。建议关注:1)视频场景:当虹科技、网达软件;2)视觉场景:海康威视、大华股份、云从科技、商汤科技。
风险提示:AI 技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。

阅读全文

本文转载自互联网,如有侵权,联系删除

相关推荐

最新文章

推荐文章