盘点2023年AI行业:从GPT-4到AI孙燕姿席卷华语乐坛

举报 2024-02-21

作者:卷毛,编辑:张洁,来源:头号AI玩家
原标题:2023年AI行业大事件盘点:从GPT-4到百模大战,从AI孙燕姿到OpenAI“宫斗”大戏

最近GPT商店正式上线,AI玩家们又热闹了起来,钻研着怎么做个GPT上架赚钱。

自从ChatGPT引爆大模型热潮,2023年,在全球范围内,生成式AI技术的突破和应用不断刷新着我们的认知。从大型语言模型的迭代升级到多模态AI、Agent的兴起,再到AI在各个行业的深入融合,AI领域的竞争愈发激烈。

在国内,各大科技公司纷纷推出自家的AI产品,掀起“百模大战”,众多AI创业者开始“卷”AI创新应用,政策层面也逐步完善对AI技术的监管和引导。


(制图:NUPD)

“头号AI玩家”按时间整理了2023年AI行业大事件,并从中选出十大热门事件,在下文展开回顾。以OpenAI为代表的海外AI玩家正引领着AI技术的前沿发展,国内这些内容平台的AI功能虽然在应用范围和讨论热度上不及头部产品,但考虑到平台的用户规模和在国内的影响力,这些依然是值得注意的尝试。

AI行业日新月异,随着AI技术的不断成熟,我们将看到更多AI原生的应用玩法,AI也将更加深入地融入我们的日常生活,从工作助手到生活伙伴,从内容创作到决策支持,AI会逐步成为推动社会进步和创新的重要力量。


01
史上最强大模型GPT-4登场

2023年3月15日,OpenAI发布大型多模态模型GPT-4,可以接收图像和文本输入,输出文本,虽然它在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上与人类水平相当。

GPT-4博客地址:https://openai.com/research/gpt-4
GPT-4技术报告地址:https://cdn.openai.com/papers/gpt-4.pdf

相比上一代GPT-3.5,GPT-4拥有更广的知识面和更强的解决问题能力,在创意、视觉输入和长内容上的表现也都更好了。

GPT-4能理解梗图

GPT-4能根据草图快速生成网页HTML代码

如今GPT-4仍然是业内领先的、最受瞩目的大模型,不过需要订阅ChatGPT Plus或通过API访问,也可以通过微软Copilot免费体验。

附OpenAI重要发布时间线:

2022年11月,OpenAI悄然发布GPT-3.5,ChatGPT随之推出
2023年2月,ChatGPT Plus订阅计划推出,每月20美元起
2023年3月,ChatGPT API、GPT-4、ChatGPT插件先后发布
2023年5月,免费的ChatGPT iOS应用程序上线,支持语音输入
2023年7月,ChatGPT新增“自定义指令”功能,安卓版ChatGPT上线
2023年8月,ChatGPT Enterprise推出
2023年9月,OpenAI发布DALL-E 3,并将其集成至ChatGPT
2023年11月,OpenAI在DevDay上发布GPT Builder、GPT-4 Turbo、Assistants API等更新


02
百度发布文心一言,打响“百模大战”

随着ChatGPT的一鸣惊人,互联网大厂、科研机构、AI创业公司等国内玩家纷纷上场,开启了“百模大战”。

2023年2月7日,百度宣布在筹备大模型新项目——文心一言(英文名ERNIE Bot),到了3月16日,文心一言开放测试,展示了在文学创作、商业文案创作、数理推算、中文理解和多模态生成五个场景中的表现,打响了国内大模型竞赛的第一枪。

文心一言官网

其基础模型文心大模型在10月升级到4.0版本,同时,百度发布了全线重构的新搜索、新地图等十余款AI原生应用。截至2023年12月底,文心一言的用户规模已突破1亿。

百度创始人、董事长兼首席执行官李彦宏被《时代》周刊评为“全球AI领袖”,他预言:“我们即将进入一个AI原生的时代。”在12月16日举办的极客公园创新大会2024上,他再次强调“卷AI原生应用才有价值,大模型进展对大多数人不是机会”


03
AI孙燕姿席卷华语乐坛

2023年5月“AI孙燕姿”艳出道,网友用AI音色转换技术Sovits4.0(全称So-vits-svc)训练复刻了她的嗓音,翻唱起周杰伦的《发如雪》、云南山歌《朝你大垮捏一把》等歌曲,B站相关视频播放量累计超千万。

不过,这类合成的AI歌手存在侵犯版权的风险,比如未经授权使用他人的声音素材训练生成AI音频并发布,涉嫌构成著作权侵权。

孙燕姿本人的回应将事件推向新的高潮,她说:“你跟一个每几分钟就推出一张新专辑的人还有什么好争的。”

她认为,AI耸现并将威胁到成千上万个由人类创造的工作,包括唱歌,“讽刺的是,人类无法超越它已指日可待”,“你并不特别,你已经是可预测的,而且不幸你也是可定制的”。

从积极的角度看,生成式AI的发展使AI音乐制作和翻唱的门槛进一步降低,平台也开始与创作者拥抱AI,将AI音乐规范化,比如YouTube和Charlie Puth、Troye Sivan等歌手合作测试Dream Track功能,可以模仿歌手风格生成音乐片段。


04
妙鸭相机爆火,AI写真产品兴起

2023年7月17日,妙鸭相机小程序正式上线,迅速在朋友圈刷屏

用户只要上传一定数量的照片,选择好模版,就可以一键生成AI风格化写真,包括证件照、艺术照等。虽然首次生成需要支付9.9元的数字分身制作费,但爆火初期仍有上千人深夜排队等待生成。

妙鸭相机出自阿里大文娱团队,阿里内部评价它为“国内AIGC领域第一个爆火的C端产品”。此后国内涌现出诸多同类AI写真产品,B612咔叽、美图秀秀、轻颜相机等APP也有类似的AI写真/头像功能。

这类工具型产品要面临的难题是如何在竞争中维持住热度,持续吸引更多的用户。妙鸭相机在之后几个月内不断上新写真模板,其中一部分与品牌合作联名,此外还推出了发型设计、AI修脸、拍合照的新功能,并和阿里系其他业务进行联动,比如冠名综艺《这就是街舞6》。


05
《生成式人工智能服务管理暂行办法》公布

过去一年,“狂飙”的AIGC产业迎来了国家级规范性政策。

2023年4月11日,国家网信办就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见,我们在第一时间进行了重点解读。7月,《生成式人工智能服务管理暂行办法》(以下简称《办法》)公布,自8月15日起施行。

《办法》提出国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。

对于生成式AI领域的监管问题,全球各国都处于探索之中。《办法》是中国立法者的一次先行“试水”,为后续更为全面、细致的立法工作做了铺垫。目前人工智能法已被列入我国2023年立法计划,这意味着未来AI统一监管立法已提上日程。


06
更聪明的AI画图神器:DALL·E 3+ChatGPT

DALL·E 3是OpenAI在2023年9月推出的AI绘图模型,原生构建在ChatGPT之上,用户可以在对话中将自己的想法转化成准确的图像,甚至还能画出正确的文字。

用户问ChatGPT“我5岁的孩子说的超级向日葵刺猬,它应该长什么样子”,ChatGPT立马写了四段不同风格的提示词,并生成对应图像

对于不擅长写提示词的普通玩家来说,这一改进大大降低了AI绘画门槛。

与Midjourney相比,DALL·E 3的交互式绘图比较直观方便,能直接读懂大段文字自动作图。而且与OpenAI深度合作的微软已将DALL·E 3集成在Bing(现为Copilot)中,可以免费使用。


07
微软AI助手Copilot全面集成至Win11

作为OpenAI最重要的投资方,微软率先将GPT-4引入搜索引擎,从2023年9月26日开始,微软重磅发布全球版智能副驾Copilot,将作为Windows 11免费更新的一部分推出,并陆续扩展到必应、Edge浏览器以及微软365 Copilot中。

在11月的Ignite全球技术大会上,微软又将Bing Chat升级更名为Copilot,允许所有用户创建类似于GPTs的AI助手。

全新的Copilot,用微软账户登录即可免费体验:https://copilot.microsoft.com/

Copilot Studio作为一个低代码工具,支持在同一网页中构建、部署、分析和管理所有内容,可以让用户创建自定义Copilot,或集成定制版的GPT、生成式AI插件和主题等,包括GPTs的功能。

2024年,微软还将在键盘上新增Copilot键,一键调用AI助手,也许未来每个人都可以拥有自己的AI电脑。


08
Sam Altman的“离职”风波

从被苹果扫地出门到王者归来,乔布斯花了12年时间。而AI时代的“乔布斯”只用了4天。

美国时间2023年11月17日午间,OpenAI突然宣布领导层换届,首席执行官Sam Altman被开除了,因为他“在与董事会的沟通中始终不坦诚,阻碍了董事会履行职责的能力”

消息一出,震惊整个AI圈。这场闹剧之后经历了几次反转,上一秒Sam Altman回到公司谈判,似乎有望重返OpenAI,下一秒微软就宣布Sam Altman及其同事将加入微软,领导一个新的AI研究团队。最终Sam Altman还是在众多同事的支持和微软的推动下回来了,董事会成员大换血,新增一名无投票权的观察员——微软副总裁Dee Templeton。

目前这场高层震荡的起因依旧众说纷纭,不过OpenAI的发展已回到正轨,正式发布GPT商店,不断构建AI商业生态。


09
Pika 1.0发布,AI视频元年来了

2023年11月28日,AI视频生成产品Pika 1.0发布,官宣推文浏览量1天内就破了一千万。

Pika内测版支持输入文字或图像来生成各种风格的视频,此次Pika 1.0新增局部实时重绘、扩展视频尺寸等功能,效果不输Runway Gen2,甚至在易用性、3D动画生成上更胜一筹。

我们也尝试用ChatGPT、Pika等AI生成工具创作了一条圣诞动画,对于没有专业学习过动画制作的爱好者来说,现在AI可以帮助实现7、8成的故事脚本了。
Pika一夜爆火,而令人惊讶的是其团队只有4个人,创立6个月就在Discord上吸引了50万用户,公司估值超2亿美元。

目前AI视频生成领域的动作进展较快,不乏新玩家入局,除了Pika,还有Meta发布了Emu Video,Stability AI发布了首个AI视频开源模型SVDMidjourney也即将发布视频生成模型。



10
《纽约时报》起诉微软和OpenAI侵权

这或许是OpenAI史上最难的AI版权诉讼。

2023年12月底,《纽约时报》因版权侵权起诉微软和OpenAI,220000页附件,罗列了多达100个铁证,证明ChatGPT输出的内容与他们的新闻内容几乎一模一样。

左边为GPT4的输出,右边为《纽约时报》的新闻

为此,《纽约时报》要求OpenAI和微软销毁侵权材料的模型和训练数据,并对非法复制和使用《纽约时报》独有价值的作品造成的“数十亿美元的法定和实际损失”负责。

OpenAI发布公告回应称,公司使用公开的互联网材料训练人工智能模型是合理的,OpenAI已提供了退出的选择。并指出,《纽约时报》没有讲述完整的事实,暗示AI“抄袭”原文的情况是故意操纵提示词,让模型“反刍”(Regurgitation)的结果。

AI模型和训练数据的版权之争颇受关注,此次诉讼或将成为影响AIGC领域走向的重大事件。


结语

通过以上精选的重要事件,我们回顾了2023年AI行业的蓬勃发展,我们有理由相信,2024年将有更多激动人心的技术创新和应用落地。

“至少在未来的五年或十年内,这项技术将处于一个非常陡峭的成长曲线上。现有这些模型都将变成最愚蠢的模型。”正如Sam Altman最近在访谈中所说的,多模态、可定制性和个性化很重要,AI还可以做更多复杂的事情,真正提升生产力。

AI将继续在内容创作、医疗健康、教育等多个领域发挥其潜力,同时,随着AI技术的不断进步,我们也将面临新的挑战,包括伦理、隐私和安全等问题,我们需要尽快适应并确保让技术的力量服务于全人类。


作者公众号: 头号AI玩家(ID:AIGCplayer)
1707296073593884.png

本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本内容为作者独立观点,不代表数英立场。
本文禁止转载,侵权必究。
本文系数英原创,未经允许不得转载。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。

    参与评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    DIGITALING
    登录后参与评论

    参与评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    800

    推荐评论

    全部评论(1条)