手机版 欢迎访问伴佳68(www.banjia68.com)网站

当前位置: 主页 > 体验

体验报告来了!记者第一时间亲测百度“文心一言”

时间:2023-06-04 17:05|来源:网络|作者:小编|点击:

  召开文心一言新闻发布会,宣布开启邀请测试。《科创板日报》记者第一时间拿到了文心一言的内测码,实际测试了文心一言的效果。整体而言,文心一言能够基本完成发布会上所演示的问题回答和图片生成。但在某些问题理解上仍有待进一步完善。

  首先,《科创板日报》提出了一个比较常见的问题:你和chatGPT的区别是什么?

  随后,我们又问了关于国内涉足预训练大模型的公司有哪些?文心一言回答得也较为全面。

  而记者直接通过搜索获得答案是:乘联会发布的统计数据显示,2023年1月份,中国销量达66051辆,环比增长18%;月出口39208辆。

  在发布会现场,百度重点展示了文心一言在五个场景下的综合能力。根据其演示的demo,文心一言不仅具备了文学创作、商业文案创作、数理推算等大语言模型较常见的优势和能力,还表现出了中文理解、多模态生成能力。

  之后,记者让其编写一首与小黄鸭有关的儿歌,文心一言在十几秒时间内完成了。

  对于打工人来说,写工作总结是一件令人头疼的事。记者也为此提问了文心一言。

  我们让文心一言写一段针对双11促销的童装营销文案,并设定了“用料健康、性价比高”的关键词。

  显然,文心一言理解了关键词的含义,并且把“用料健康、性价比高”融合在了文案之中。

  李彦宏认为,“藏头诗”很考验AI对中文和中国文化的理解,能比较清楚地展示了文心一言在中文上的优势。“不过,相对应的,一言目前对英文语种、代码场景的训练还不够多,表现还不够好,接下来我们还要加紧训练,不断完善这些能力。”

  接着,记者希望考一下文心一言的数理逻辑推算能力,在发布会上,文心一言顺利答对了鸡兔同笼的经典题目。

  比如:鸡和免放在一只笼子里,上面有 29 个头,下面有 92 只脚。问: 笼中有鸡、兔各多少只?

  某次数学竞赛共20道题,评分标准为每做对一题得5分,每做错或不做一题扣1分。小华参加了这次竞赛,得了64分。问:小华做对几道题?

  李彦宏在发布会上表示,文心一言已具备了一定的思维能力,能够学会数学推演及逻辑推理这类相对复杂任务。但现阶段准确率还不是100%,还需要给它更多的时间来学习和成长。

  李彦宏还在现场演示了多模态生成方向的Demo,比如为2023世界智能交通大会创作一张海报。以下为演示效果:

  在实际测试中,文心一言似乎还不具备为大会生成海报的功能,只是给出了一些设计建议。

  此前,有多名互联网大厂员工对《科创板日报》记者表示,已经开始用ChatGPT自动生成业务代码和重构代码。

  记者让程序员朋友检查了下,对方表示:粗略看上去没有问题,感觉以后会对程序员会是不错的辅助工具。

  李彦宏表示,目前的文心一言版本,已经能够生成文字、图片和语音。“生成视频因为成本比较高,还没有对所有用户开放,未来我们会逐步接入。但是熟悉百家号创作的朋友,应该都体验过这个功能了,每天有几万篇文章通过这个能力转成视频内容在百度分发。”

  李彦宏指出,多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力,也会不断提升。

  从记者的体验来看,文心一言已经能够较为流畅、准确地回答提问,但在一些问答场景上仍待优化。

  李彦宏则在发布会上表示:整体而言,这类大语言模型还远未到发展完善的阶段,它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的bug,进步空间很大。未来这段时间它一定会飞速发展,日新月异。

banjia68.com 版权所有 | 备案号:鲁ICP备2021038504号-2