大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生
2023-06-08 20:52:53 来源:量子位

鱼羊 萧箫 发自 凹非寺

量子位 | 公众号 QbitAI


(资料图)

ChatGPT诞生后的第一场全国高考,考生忙,大模型们也很忙。

这不,高考还没结束,AI挑战高考题就成了刷屏热搜话题,各家大模型都被拉出来写起了高考作文,甚至是参与整场考试。

(不知是不是巧合,Bard还在下午数学高考后,紧急升级了一波数学推理能力……)

结果,竟然有大模型写的作文,把资深高中老师都骗过了!

就在考试当天,百度搜索正在内测的“AI伙伴”,现场直播挑战了一套语文试题。

从“基础题”文言文翻译、阅读填空、古诗词赏析,到“拉分题”微写作和作文,AI伙伴全部上手做了一遍。

结果,当9份“混进”了AI伙伴作品的高考作文送到语文老师庄临旭手上时,他完全没发现有篇是AI写的:

我是真没想到,AI还能写文言文作文

紧接着,AI伙伴展现的文言文理解能力,更是把资深老师吓了一跳:

凭借我的教学经验来看,超过95%的同学没问题。

一整场直播下来,就连围观了AI伙伴考试全程的毕导都感慨:

再来一次高考语文,我可能考不过它……

所以,集成了百度语义检索技术+大模型能力于一身的AI伙伴,整场考试表现具体如何?

咱们一项一项展开来看。

“AI考生”现场挑战语文高考

先来看看大模型的“基础题”——古诗词赏析

面对情感和写法的“找不同”问题,百度搜索AI伙伴胸有成竹,不仅给出了明确的修辞手法,还进一步分析了古诗的来历和情感,属实是阅读理解十分到位了:

再到阅读填空。面对文章解读和“续写句子”能力,AI伙伴同样毫不逊色:

那么,来看看大模型的“拉分题”写微作文,依旧没什么问题!

要是小作文体现不出来,再来看看AI伙伴作诗的能力。不仅现代诗手到擒来,甚至连藏头诗都能搞定:

不过,要是再仔细一点搞搞提示词工程,AI伙伴似乎就答得更好了。

以高考语文题目中的古诗词理解为例,这里我们先在不给提示词的情况下,把题目原样“喂”给AI伙伴:

AI伙伴给出来的答案虽然也不错,但对于高考题目来说,这答案着实有亿点长,也有点太仔细了:

接下来,给AI伙伴换上强调“最重要的三个意象”的提示词。

果然,AI给出了更精准的回答,指出包括病柏、丹凤和鸱鸮在内的三个意象,是最关键的:

但是,上述都还只是直播中展现出来的效果。像AI伙伴这类有大模型加持的功能,其使用效果是否真的和提示词工程强相关?

为了测测AI伙伴的“真正实力”,我们亲自上手测了测它做高考题的效果。

直播中已经做过了全国甲卷的作文题目,那么我们再来试试今年上海卷的作文。

第一轮,我们直接把题目甩过去:

看起来,AI伙伴虽然理解了文章“主旨”,但写出来还差点意思:论点不够明确,作文的结构也不太清晰。

第二轮,我们试着换了一下提示词,给AI伙伴设置一个“角色扮演”效果。

首先,强调它是一名高考考生,然后给它“灌输”一些高考作文的写作技巧:

这一轮,AI伙伴写得就有高考作文内味了。

不仅给出了10字以内的标题,还按照总分总、夹叙夹议的方式,很好地写出了一篇议论文:

看起来,挖掘大模型的潜力,很大程度上确实要依靠提示词工程。

在直播中,百度集团副总裁、搜索平台负责人肖阳还给我们列举了一个非常简洁的提示词公式:

提示词 = 任务 + 角色 + 上下文背景 + 细节补充。

有了它,不用再担心大模型输出和设想无关的答案了。

当然,作为百度“用大模型重塑搜索能力”的终极杀器,AI伙伴能实现的功能,也远不止是做做高考题而已。

最早在2023万象·百度移动生态大会上官宣发布的AI伙伴,目前已经开启内测,获得试用资格后,可以直接从百度搜索界面进入:

它的本职工作,更像是一个搜索引擎端的全能AI助理,不仅具有智能搜索能力,还兼具创作生成技艺:

一方面,AI伙伴相当于一个对话版智能搜索工具。用它查资料,不需要再按关键词搜索,直接“用人话”提问就行:

不仅如此,每一句回答都有理有据,如果想要“追根溯源”,直接点链接就能跳转到对应的网站:

这样一来,就不用担心它会出现像ChatGPT整理文件那样,出现“无中生有”一些案件的操作了。

另一方面,它又相当于一个多模态大模型创作助手

不仅可以帮助查资料、写周报、画头像,还能陪你模拟面试、甚至替你约会(?)。

这里我们借助AI伙伴的“程序猿小助手”,来试试生成一段代码的能力。

以面试可能会考到的冒泡排序算法为例。

很快啊,几乎没有怎么思考,AI伙伴就给出了一段带注释的冒泡排序算法,最关键的是,它自己已经运行过,并成功输出了一段结果

这意味着我们不需要再自己去跑一遍这段代码,而是能直接将它交给面试官了(doge)

从上面这些展现的能力来看,AI伙伴所能做到的,远非仅仅提供高考试题“参考答案”而已。

这次选择用它挑战高考题,大家伙可能看的是个新鲜劲儿,但“术”的表象之外,更值得关注的是“道”的变化:

使得AI伙伴能在高考题面前依旧“神采飞扬”的大模型技术,正在以搜索引擎的代际变革为基点,席卷各行各业,甚至改变每个人的工作方式。

正如ChatGPT搅动风云之初,微软CEO纳德拉预测的那般:搜索正面临巨变。

并且变化的不仅仅是搜索的技术、产品本身,这一次,更与每一个个体有了更紧密的关联。

搜索三变

百度CEO李彦宏同样认为,“大模型即将改变世界”。基于这样的判断,李彦宏2023年一季度OKR,便指向了“引领搜索体验的代际变革”。

现在,三个月过去,大模型究竟如何变革搜索,现在答案已经越来越清晰。

从技术的角度出发,大语言模型的爆发,正在重新定义人机交互

对于人类而言,最自然的交流方式就是语言沟通。而大模型的代际突破,最直观的一点体现,就是机器自然语言聆听表达能力的飞速提升。

回答来自百度搜索AI伙伴

搜索本身,就是一种人机交互的核心方式。其本质的技术追求,就是要让机器更高效地理解、推理、表达,化复杂问题为直观的第一条搜索结果。

因此可以说,大语言模型的突破,正在全面激发搜索全新的潜能。

值得关注的一点是,伴随着AI的发展,搜索始终都是最前沿AI技术最先落地的场景。

以百度搜索为例,围绕“降低用户表达需求门槛”、“降低用户获取内容和服务的门槛”、“丰富搜索引擎的内容供给”这三个目标,百度搜索一直在AI技术上大量投入。

引入大模型之前,百度搜索已经实现:

千亿级全网索引;

全球领先的深度语义理解技术,相关成果曾获2020年国家技术发明奖二等奖;

最大中文知识图谱,覆盖50亿实体。

从产品的角度看,过去三个月,数据已经证明,对话式搜索正在成为搜索引擎市场的一个新变量。

百度集团副总裁、搜索平台负责人肖阳就透露,大模型加持下的AI伙伴,在内测阶段就已爆火,相关搜索问答量激增。

这进一步佐证大模型带来的新人机交互方式,更能满足人们对搜索“快速”、“有效”的诉求。

牵一发而动全身,在现在这个时间节点,围绕搜索的内容生产和创作领域,创新模式也开始逐渐显现,并被积极地探索实践。

同样是在万象大会上,百度搜索还配合AI伙伴,推出了AI BOT解决方案。目的就是向内容、服务生产者释放大语言模型和AI技术能力,降低其与新搜索模式融合的门槛。

具体来说,百度搜索提供了创作者、商家、机构、服务和品牌等各类型的AI BOT,让他们能够利用自身优势和独特的内容、知识、服务,创造虚拟分身,直接回答用户的问题。

在技术和产品之外,更与每个人息息相关的,是用户搜索方式的改变

正如前文所展示的,大模型时代,“提问题”的能力正在变得越来越关键。

体现在现阶段,就是提示词写得好不好,会直接影响搜索生成结果的质量。是否掌握提示词工程能力,就像互联网时代开启时,是否掌握搜索能力一样关键。

对此,肖阳提到了“搜商”的概念:

未来不仅要卷智商、情商,还要卷“搜商”。

更好地使用提示词,更好地使用AI伙伴,获得的优势会越来越大。

也就是说,找到合适提示词的能力越强,越能在大模型落地应用的时代里,充分利用大模型的强大生产力。

可以说,大模型刮起的时代风暴之下,搜索三变,既是内在技术瓶颈的代际突破,亦是外在人类接触信息方式的彻底变革。

无怪乎肖阳作为技术变革的一线亲历者,会有这样的判断:

语义检索技术与大语言模型结合,促进搜索的理解、推理、组织和创作潜能进一步释放,有望在多方面催生颠覆式创新,促成搜索奇点降临

并且这一次,或许每一个人都会真真切切感受到这种代际变革带来的影响。

One More Thing

说起来,就在高考这两天,AI加持下的百度搜索,忙的还不止有刷题这件事儿。

每年此时,百度都会启动专门的高考服务,通过搜索和AI核心技术,为考生和家长提供便利。

今年,百度还基于AI技术,首次推出了高考搜索指数,涵盖专业搜索热度及变化趋势、“院校PK”等信息。考生家长在择校选专业的时候,可以更方面地参考对比。

AI志愿助手也进行了重大升级,能更直观地展示志愿预测结果,提供相关数据来辅助考生家长做决策。

对了,利用高考搜索指数和其他高考相关搜索数据,百度还联合中国教育在线掌上高考发布了不少有意思的数据:

高校方面,搜索热度最高的本科院校里,南方高校霸榜双一流和非双一流大学前十。

专科院校中,山东是搜索职业教育最多的省份。

专业方面,医学搜索热度断层第一,航空航天热度攀升最快。

而最有“钱”景的,是船舶电子电气工程……

大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生

2023-06-08

仙剑奇侠传三游戏怎么窗口化(仙剑三窗口化工具) 每日速看

2023-06-08

金融培训赋能 政银企通力共进助推吉林文旅产业发展 快播

2023-06-08

部分省份今天下午结束高考,6月下旬陆续公布成绩 当前滚动

2023-06-08

每日视讯:勇士休赛期面临的三大问题:只有底薪可用 追梦&迪文可能跳出合同

2023-06-08

欧意app官方下载最新版_欧亿平台2023v3.056

2023-06-08

天天热资讯!广东实施自贸试验区提升战略 开展高水平开放压力测试

2023-06-08

世界第一大城市贵阳什么梗_世界第一大城市 全球报资讯

2023-06-08

瑞泰科技:目前公司已形成玻璃、水泥、钢铁三大业务板块 全球百事通

2023-06-08

焦点关注:网传三利谱进入苹果产业链?公司证券部回应:目前还没有

2023-06-08

漯河:BIM为智慧城市建设插上翅膀

2023-06-08

淘气爷孙29集_淘气爷孙2部

2023-06-08

每日快报!中国联通数字技术助力信息无障碍和适老化改造

2023-06-08

乐享缤纷童年,唐昌镇幼儿园载歌载舞欢庆六一! 当前信息

2023-06-08

2023高考“故事”_全球速讯

2023-06-08

亚联发展:目前公司未参与《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023—2024年)》的相关建设 环球热点

2023-06-08

沙特额外减产无法盖过需求忧虑! 国际油价延续跌势-天天关注

2023-06-08

通讯!通化师范学院学子在第5届中国大学生射箭(射艺)锦标赛上喜获佳绩

2023-06-08

康乐县这个搬迁安置项目正在加速建设

2023-06-08

土耳其里拉持续贬值 再创历史新低

2023-06-08

市场回暖国内头部磷酸铁锂供应商龙蟠科技4至5月出货量大增 今日热闻

2023-06-08

致闽清1302个你:旗开得胜,金榜题名! 天天聚看点

2023-06-08

双星新材股东户数下降1.34%,户均持股10.48万元 环球今日讯

2023-06-08

环球快看点丨女尊之一生一世一双人小说(女尊之一生一世一双人)

2023-06-08

连夜通报!发现2例,已隔离

2023-06-08

壬午年是东四还是西四命_壬午年是哪一年-每日快看

2023-06-08

港股异动 | 康哲药业(00867)午后涨超4% 国内首个IL-23抗体益路取获批上市 环球播报

2023-06-08

注意!三角轮胎将于6月28日召开股东大会 天天播报

2023-06-08

断章卞之琳赏析简短_断章卞之琳赏析

2023-06-08

全球聚焦:澳第一大行澳大利亚联邦银行禁止员工使用ChatGPT 采用自有AI系统

2023-06-08

因狄斯的谎言阿尔贝无限流阵容搭配推荐 具体一览 滚动

2023-06-08

八闽岳祖白岩山|环球热点评

2023-06-08

江西省教育厅介入“高校食堂吃出疑似老鼠头”事件 其他承包商称受到牵连 全球今日报

2023-06-08

当前焦点!岳阳兴长:公司惠州项目预计于2023年9月投产

2023-06-08

每日速递:重庆:红外相机记录到多只红腹锦鸡求偶场景

2023-06-08

视点!微软在 Edge 浏览器中展示伪装成 AI 搜索结果的必应广告

2023-06-08

【全球速看料】浙能电力:水系锌离子目前尚未完成结题验收,但性能测试达到项目计划书指标要求

2023-06-08

6月6日利率债市场收益率整体下行-焦点速递

2023-06-08

一路荆棘的暗黑图片_一路荆棘的意思 快报

2023-06-08

【世界新要闻】雷雨大风+冰雹+龙卷!黑龙江省发布龙卷预警

2023-06-08

新资讯:2023年中考政治冲刺复习知识点:带有“二”的知识点

2023-06-08

世界即时看!端午节作文三年级下册300字

2023-06-07

北京电信多条千兆专线护航通信展览会 全力做好通信保障服务|环球新消息

2023-06-07

【速看料】杭州首位走出考场的考生喊话马化腾:新版QQ空间太难用了

2023-06-07

创业板指跌1.61% 新能源领跌、旅游与传媒股走强

2023-06-07

鸳鸯的古诗有哪些 关于鸳鸯的爱情诗句

2023-06-07

高考今日进行 请您开启“静音”-快报

2023-06-07

深刻有品味的文案-每日速讯

2023-06-07

杰创智能:公司主营业务暂未直接涉及电子身份证领域

2023-06-07

每日讯息!消费警示:警惕培训班退费骗局

2023-06-07

大连:多措并举 保驾护航 助力滨城莘莘学子逐梦高考

2023-06-07

俄罗斯科学家利用活细胞实现人体组织3D打印 世界微头条

2023-06-07

2023年房屋征收,拆迁补偿协商处理,这5点要注意_世界观速讯

2023-06-07

【全球播资讯】Norges Bank增持万物云(02602)290.36万股 每股作价约28.19港元

2023-06-07

全球头条:海关总署:前5个月我国进出口增长4.7%

2023-06-07

每日动态!优美古诗词取名_优美古诗句

2023-06-07

受托加工物资怎么做账_受托加工物资的会计分录如何做

2023-06-07

华安证券:苹果开拓性MR新品发布 持续催化传媒行业内容生态型企业向好

2023-06-07

世界看点:平安守护 时刻行动

2023-06-07

生化危机重制4mod_生化危机4mod福利 当前热文

2023-06-07

宝鸡三和职业学院有哪些专业 宝鸡三和职业学院专业排名

2023-06-07

每日快播:长治经开区13家企业上榜省级创新名单

2023-06-07

来长宁这里看月份牌年画展,感受非遗技艺的多样魅力!

2023-06-07

“税务蓝”走进校园 助力就业创业|环球实时

2023-06-07

环球新消息丨国际硕士和国内非全日制硕士优缺点对比

2023-06-07

佳乐股份承建的"金沙伟业光伏电站项目"成功并网发电

2023-06-07

回归法律服务初心 促行业高质量发展

2023-06-07

环球观焦点:深南电A:下属南山热电厂已进行虚拟电厂备案,暂未实质性运行

2023-06-07

安徽新华书店开展助考送温暖活动

2023-06-07

前沿资讯!张仲景的伤寒杂病论并著述了什么内容_张仲景的伤寒杂病论并著述了

2023-06-07

徐汇劳模体检专场新增口腔体检项目,全国劳模带队服务

2023-06-07

蒲公英的作用与功效有哪些_蒲公英的作用与功效是什么 今日热搜

2023-06-07

推动实现“家门口的幸福”!苏州相城黄桥街道聚力党建便民服务-全球报资讯

2023-06-07

北京大兴机场恢复英国伦敦航线_全球快资讯

2023-06-07

社保交满15年后退休金有多少 养老金的具体计算方式方法大全_环球时讯

2023-06-07

白糖期货主力合约持续回落 近远月合约价格倒挂现象凸显

2023-06-07

瑞文哪个皮肤手感最好_瑞文哪个皮肤手感好 天天观察

2023-06-07

华为云CEO张平安:自研数据库GaussDB真正实现软硬件协同优化_天天观天下

2023-06-07

世界快报:北京市2023年6月7日11时50分发布雷电蓝色预警信号

2023-06-07

信息:最高人民法院关于审理非法生产、买卖武装部队车辆号牌等刑事案件具体应用法律若干问题的解释(对于最高人民法院关于审理非法生产、买卖武装部队车辆号牌等刑事案件具体应用法律若干问题的解释简单介绍)

2023-06-07

天奇股份:股东张宇星、李明波减持计划实施完毕,共减持公司股份约36万股

2023-06-07

众智科技:6月6日融资买入2695.06万元,融资融券余额5339.31万元

2023-06-07

省商务厅领导到淮安综保区调研

2023-06-07

环球热资讯!固定收益类为什么还亏?

2023-06-07

世界热头条丨硅宝科技:6月6日获融资买入359.27万元

2023-06-07

环球速递!沪深股通|江山股份6月6日获外资买入0.01%股份

2023-06-07

巴勒斯坦总统:期待推动巴中双边关系取得更大发展 今日最新

2023-06-07

【环球聚看点】低价与内容都要,淘天如何适配中小商家?

2023-06-07

福特汽车接近达成出售德国工厂协议 据悉比亚迪等三家团体为主要竞标者_当前热门

2023-06-07

4g fdd-lte;4g td-lte什么意思_td在污的方面是什么意思是什么东西的缩写

2023-06-07

湖南文科380分能上什么学校理美术生化大

2023-06-07

安德烈·古辛 世界简讯

2023-06-07

节气里的中国智慧丨今日,芒种

2023-06-07

儿白是什么意思_儿白是什么意思东北话 头条

2023-06-07

怎样删除手机病毒数据_怎样删除手机病毒软件|环球速讯

2023-06-07

哈密瓜营养价值及功效_哈密瓜营养价值

2023-06-07

高考“调休”来了!高考期间,上班人有这些注意事项

2023-06-07

报吃是什么意思梗_花吻疗法是什么意思是哪里的梗

2023-06-07

跨火盆百度百科_跨火盆是什么意思为啥说有肖战就跨火盆

2023-06-07

全球即时:冬泉谷的豹子在哪里_冬泉谷的豹子

2023-06-07