“不逊色 GPT
就在适才 ,不逊文心大模子 4.0 版本正式宣告 !不逊
北京首钢园现场 ,不逊李彦宏直接放话:

话未多少说,不逊一起来看现场演示下场 。不逊
先来段倒装 prompt:
不光关键信息“北京使命”放在了最后,不逊公积金详细是不逊在哪里交的也不昭示。
但新版文心一言残缺不被这些小陷阱坑到,不逊顺遂给出了精确谜底 。不逊

天生方面 ,不逊就地剪出一整段数字生齿播视频 ,不逊绝不难题 :

解起数学题来也为非作恶,不逊可能说是不逊家长教育作业神器了(doge)。

新版文心一言还现场写起了武侠小说,不逊纵然不断削减人物脚色 、不逊削减戏剧矛盾 ,也不会泛起影像凌乱 、前言不搭后语的情景 :

如斯展现,着实是让现场不雅众 high 了一把。
文心大模子 4.0 相关话题,也赶快被国内外网友们热议起来。

据现场介绍,比照线上 3.5 版本的文心一言,文心大模子 4.0 后退清晰:仅 9 月启动小流量测试这以前的一个月 ,就又提升了 30% 。
那末,下场来了:文心大模子 4.0 真有这么好?详细与 GPT-4 相差多少多 ?
当初,文心大模子 4.0 已经开启邀测,量子位也在第一光阴拿到了测试资历。
咱们直接实测走起 。
取患上测试资历后,切换到文心大模子 4.0,就能开始顽耍了。

比照文心大模子 3.5 刚进去的时候,文心大模子 4.0 如今已经进化出了更多功能 ,光是插件就有 8 个,搜罗一镜流影(翰墨转视频)、说图解画(看图语言) 、E 言易图(可视化数据合成)等。
这些插件还可能逍遥组合 ,来实现更重大的使命 。

baidu谢世界大会现场 ,重点演示的仍是文心大模子 4.0 的图文创作 、数理逻辑推理等合勤勉用 。那咱们仍是老模样 ,从更根基的角度动身,测测它的四大“根基功”——
清晰 、天生、逻辑以及影像能耐 。
清晰能耐,特意是中文清晰能耐
第一波,先来看看文心大模子 4.0 的清晰能耐。
这里咱们主要考考它应答“语言陷阱”的能耐 ,以及收集段子的“识别力”。
先来其中文十级能耐测试题 ,考考大模子事实懂不懂“真的假的”是甚么意思。

文心大模子 4.0 的回覆很简洁 ,直接给出谜底。

GPT-4 则要每一句话都子细合成句意,最后再给出回覆:

尽管更子细,但总感应有点像是在子细做中文测试的歪果仁(doge)。
再来上点难度,“小偷偷偷偷工具”。
文心大模子 4.0 很快拆解出了“小偷”、“偷偷”以及“偷工具”三个词,get 到了这句话的意思:

不外 ,GPT-4 反而一头“栽”进了这个陷阱中 ,以为中间的两个“偷”也是动词 ,最后还漏了一个偷……

审核完语言陷阱后,再来看看双方对于收集段子的清晰。
针对于“哪李贵了”这个外乡梗 ,文心大模子 4.0 很快给出了谜底 ,人物使命都直不雅:

GPT-4 假如不开搜查 ,会 get 不到 2022 年 1 月之后的梗:

但假如掀开搜查 ,很快也能“与时俱进”,给出这个下场的谜底:

同理 ,咱们也试了试从外洋传入国内的梗。
文心大模子 4.0 以及 GPT-4 都能回覆进去,文心大模子 4.0 更提要一些 ,GPT-4 则是直接搬运了一套百科(更详细 ,但 tokens 也更贵💰……):


收集段子测评看下来,文心大模子 4.0 以及加了搜查的 GPT-4 可能说是各有千秋。
多模态天在行腕
那末接下来这波 ,就要魔难当下最受关注的大模子多模态天在行腕了 。
先来试试图像天在行腕,特意审核一下对于新诗“孤舟蓑笠翁 ,独钓寒江雪”的清晰 。
文心大模子 4.0 很快给出了 4 张图像