测评5个最火大模型,总结出一份实用操作攻略

举报 2025-03-12

测评5个最火大模型,总结出一份实用操作攻略

内容作者:小小,编辑:郑晶敏
原标题:测评了5个最火大模型,我破解了AI人格密码(附攻略)

过去一个月,相信很多创作者的工作流已被AI部分接管:

写稿卡壳时找DeepSeek发散脑洞,查资料时使唤Kimi跑腿,做PPT时抓豆包渲染图片。

用久了就会发现,这些AI不仅仅是工具,而更像一群性格各异的实习生——
有人精于抖机灵但满嘴跑火车,有人闷头干活但毫无情趣,还有人试图用高情商话术掩盖逻辑漏洞。

“确诊为DeepSeek人格”之类的话题也一度让网友们玩梗。

网友们把自己代入各种AI,重新定义“16型人格”,比如“很聪明但不干活”的DeepSeek型人格,“有点笨但特别勤奋”的豆包型人格,“海归留子你用不起”的ChatGPT型人格……

最近OpenAI推出的GPT-4.5更是“人格”鲜明。

继DeepSeek的推理“魔法”、Grok-3的算力“武器”之后,GPT-4.5展现了一种“高情商AI”的范式。

当AI们侧重的能力维度越来越多样,它们各自的人格也就越来越鲜明。

我们通过测评,总结出以下“AI人格图谱”以及创作者使用攻略。


01 GPT-4.5 :优雅的高情商人生导师

如果给GPT-4.5贴一张人格标签,它大概率是“一线城市中产最爱的心理咨询师”——穿着亚麻衬衫,说话温和克制,总能从你的抱怨中提炼出“自我价值重构建议”;

但上千元/小时的咨询费,又让人忍不住怀疑它华而不实:“这些共情话术,到底值不值这个价?”

高情商和超昂贵,就是GPT-4.5最显著的特点。

GPT-4.5推出时,山姆·奥特曼称这是让他“第一次感觉像和一个有思想的人聊天”的模型,他震惊于居然真的能从AI那儿获得不错的建议。

有用户实测后也发现,相较于其他AI,与GPT-4.5的对话体验更近似于人类的沟通和情感表达模式。

比如,当用户表示自己失恋时,其他AI会直接给出大量行动建议,而GPT-4.5则是回复“想聊聊你们的故事吗?”仿佛它和人类一样有直觉,能够和用户感同身受。

同样被认为高情商的还有DeepSeek。

而GPT-4.5的优势在于,它更加循循善诱、春风化雨,而不像DeepSeek喜欢“掉书袋子”、三句一比喻、五句一金句,似乎在共情用户的同时还想考考用户的阅读量。

擅长情商并不意味着GPT-4.5降智了。

事实上,GPT-4.5的幻觉率从GPT-4o的61.8%降至37.1%。OpenAI研究员Mia Glaese对此表示,“如果你知道更多的事情,你就不需要编造东西”。

但这份优雅的代价极其昂贵。

GPT-4.5的API输出价格达到每百万tokens75美元,是DeepSeek优惠时段的130倍。普通用户的使用门槛也很高,奥特曼表示由于GPU不够用,目前只有Pro用户才可以使用,而Pro的月费是200美元;本周将推广到Plus用户,月费是20美元。

测评了5个最火大模型,我破解了AI人格密码


使用攻略:

1、情感咨询、创意提案等“情绪溢价”场景才能值回票价。
2、用“我希望得到有温度的回应”触发共情模式,用“请列举可落地方案”关闭废话模式


02 DeepSeek :慵懒的市井段子手哲学家

如果说GPT-4.5是CBD精英咖啡馆里的心理咨询师,DeepSeek就是混迹胡同口的热心大爷。

它既能用土味段子逗乐,又能一针见血剖析社会现象,主打一个性价比与烟火气。

每百万tokens8元的标准价,超高性价比让DeepSeek成了不少中小企业和个体户的赛博军师。

对个人来说,它又是忠实耐心的朋友,以及永不枯竭的灵感永动机。

而它的语言风格,像极了互联网时代的野生智慧:不端着、不完美,但足够鲜活。

从它的文字里,总能看见一点贴吧、知乎、小红书里高质量网友的味道。就连它的幻觉和漏洞,都有一种荒诞的幽默感。

作为“员工”的DeepSeek,虽然便宜、实在,却很挑活。

比如当我提问其创始人的相关问题,它直接罢工:

测评了5个最火大模型,我破解了AI人格密码

还会随时宕机,在一众勤奋的AI当中,有着独一份的慵懒:

测评了5个最火大模型,我破解了AI人格密码


使用攻略:

1、文字创作场景优先使用DeepSeek,尤其是短视频脚本、热点评论等需要网感的领域,并容忍20%的胡扯,当交“创意税”。用5%的时间成本批量生成100条备选文案,人工筛选好过自己憋灵感。
2、涉及数字、学术概念时,在提示词中加一句“请用小学生能听懂的话解释”。
3、虽然DeepSeek本体比接入它的其他模型聪明,但建议同时开多个模型,以防它一言不合就罢工。


03 Grok-3 :大胆叛逆的天才高中生

算力投入炸裂的Grok-3,则像极了自诩“全校最聪明”的刺头少年,热衷标新立异,但考试成绩却时常打脸。

消耗20万块GPU训练出来的Grok-3,在响应速度上秒了不少AI工具。

当我在等待其他AI回答的几秒间隙,Grok-3可能已经回答完了。让我梦回学生时代的课堂上,当大部分人还在费劲理解老师的提问,总有学霸大声喊出了答案。

这类学霸往往大胆而没有边界感。

Grok-3在小红书等中文社交媒体上,最出圈的应用是写小黄文。当其他AI都克制地限制用户生成18禁内容时,用户在Grok-3即使并非刻意,也会生成一堆大胆的图片。

Grok-3推出时,官方还将Grok-3可以处理敏感议题作为宣传点,比如伦理困境、政治争议等。不过,官方给出的理由是,Grok-3有价值观校准机制,使回答保持开放,又不会走向极端。

Grok-3的缺乏边界感,体现在它将X平台的用户数据用于模型训练。它对用户隐私的漠视,让不少用户和隐私敏感行业集体抵制。

当其他AI在内容安全上一致谨慎,刺头Grok-3似乎不那么在乎争议,这像极了马斯克本人。倒不如说,Grok-3最大的人格,或许就是马斯克自己的人格。


使用攻略:

1、追国际热点、玩梗吃瓜的一把好手。
2、用Grok-3写文的“太太”们,建议用合规AI检查一遍,降低风险。
3、用Grok-3抓取X平台上的行业信息,有助于快速了解行业的海外实时动态。‍‍‍‍


04 豆包:贴心全能的社区大姐

如果AI工具圈是个小区,多模态“杂活王”豆包就像常驻在万能修补摊的大姐——裁裤脚、配钥匙、修高压锅,收你五块钱还附赠一袋葱。

没有GPT-4.5的优雅深邃,也学不会DeepSeek的疯癫造梗,但丰富的能力,让它成了学生党、小店主、家庭主妇的“数字家政阿姨”——不惊艳,但管饱。

它的核心竞争力在于不挑活,虽然算不上“六边形战士”
但至少真的有“六边形”——写作、修图、做表、写代码、做PPT……虽然成品不建议细品,但不会出大问题,紧急时候够交差。

当它解决不了我的问题,则会补充一些别的资料,主打一个“不会写也不能空着”的文科生思维。

看似有点笨,但情绪价值拉满,就像班里那些平庸但能给老师安全感的学生。


使用攻略:

1、需要搜集国内即时资讯时,豆包比起以为自己还活在2023年的DeepSeek强得多。
2、工作以外的日常场景,豆包的语音交互可以让AI使用体验更加丝滑,不需要斟酌提示词。


05 Kimi:勤恳的学术极客研究员

Kimi则像实验室里的技术宅,痴迷长文本分析与冷门知识挖掘,对于专业一丝不苟,社交技能则接近负数。

和Kimi对话有时让我想起《IT狂人》里,以“人机感”著称的Moss,当你让他帮你修电脑,他给你长篇大论地介绍电脑的各种软硬件系统的运作方式。

我时常让Kimi帮我查找数据来源及其链接。

当其他AI工具浏览几十个网页后,仍然罗列出几篇二次引用的文章时;Kimi已经快准狠地给出原始来源的链接,输出的只有短短一句话。

而当GPT4.5、Grok-3争相给自己贴上高情商、幽默感的标签时,Kimi仍然拒绝拟人。模仿人类的情感流露对Kimi来说似乎是累赘。

就连Kimi的推理模型“长思考”(k1.5),其推理过程也更加忠于用户输入的字面意思,而不像DeepSeek那样喜欢猜测用户的言下之意、无中生有。


使用攻略:

1、硬核内容的学术外挂:创作研究型内容时,利用Kimi处理长文本的能力,辅助查找、阅读文献。
2、适用于需要严谨、高安全性回答的专业领域。


06 写在最后

没有哪个硅基生物是完美的,正如没有完美的人类。人类之所以有“人格”,就是因为他们的缺陷和闪光点一样多。正是这种微妙的平衡,才让人性显得可爱。而特长各异、缺陷各异的AI们,也开始显现出它们的可爱之处。

与其造一个完美AI,不如用N个不同性格的AI,来满足、激发、映照人类自己的N种需求和欲望。它们不光是替我做事,更让我看到人类优秀品质的最大公约数——比如温柔、幽默、敏锐、严谨。

随着大模型军备竞赛即将陷入算力内卷,未来的竞争点之一可能就在于——用户更愿意喜欢什么样的“AI性格”。我们也期待看到更丰富多样的“AI性格”。

本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本内容为作者独立观点,不代表数英立场。
本文禁止转载,侵权必究。
本文系数英原创,未经允许不得转载。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    DIGITALING
    登录后参与评论

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    800

    推荐评论

    暂无评论哦,快来评论一下吧!

    全部评论(0条)