当前位置: 首页 >  新闻中心  >   >  正文

当前信息:智商超过99.9%人类,ChatGPT到底有多聪明?

  • 2023-04-14 14:29:34 来源:钛媒体APP

图片来源@视觉中国


(资料图片仅供参考)

在过去的两个月,ChatGPT引起了学术界、科技界、传媒界的疯狂讨论。这个号称地表最强的“人工智能聊天机器人”只花了5天时间,用户就突破了100万,成为世界上达到百万用户数最快的应用。

ChatGPT,不仅能跟你对话,还能完成撰写邮件、视频脚本、文案、翻译等一系列基础工作,涉及历史、科技、文化等诸多领域,甚至还能写诗、写论文、编代码、改bug、求医问药等,一部分人不禁开始为人类终将要被人工智能取代而恐慌。那么,如今大火的ChatGPT是否具有与人类相当的智商与心智水平?

Eka Roivainen是一名来自芬兰奥卢大学附属医院的评估心理学家,他的研究方向包括认知和人格心理学以及心理测试的有效性。在了解到ChatGPT所拥有的多种人类技能后,Roivainen不禁好奇:以人类的标准看待,ChatGPT究竟有多聪明?

超越99.9%的人类:ChatGPT表现出超高智商

于是,Roivainen开始着手对ChatGPT进行智商测试。他表示,ChatGPT十分适合作为一个被试,它不仅不会在测试中表现出应试焦虑、注意力不集中或放弃,也不会对智商测试和测试人员产生质疑。

Roivainen采用第三版韦氏成人智力量表(the Wechsler adult intelligence scale, WAIS)对ChatGPT进行了智商测试。该量表包括6个语言子测试集与5个非语言子测试集,智商测试的最终分数基于所有11个子测试集的分数。平均智商设为100分,测试量表的标准偏差为15分,这意味着最聪明的10%和1%的人的智商分别为120和133。在6个语言测试集中,第六个子测试集为数字广度,它对注意力、短时记忆能力进行评估,由于不能使用文字形式展示给ChatGPT因此没有对ChatGPT进行该测试。他从词汇子测试集开始对ChatGPT进行智商测验。由于ChatGPT接受了大量在线文本的训练,Roivainen预计该测试对ChatGPT来说应该是比较容易的(词汇测试集对单词、语言概念的形成进行测试)。

不出所料,ChatGPT表现很好,它给出的答案通常非常详细和全面,甚至超出了测试手册中给出的正确答案的标准。在知识和相似性子测试集中ChatGPT也表现良好,达到了最高分(知识子测试集是对常识的测试,反映了求知欲、教育水平以及学习和记忆事实的能力)。相似性子测试集测试抽象推理和概念形成能力。在这个子测试中,聊天机器人倾向于给出非常详细、复杂的答案。在算术子测试集中,ChatGPT正确回答了所有提供的算术问题,包括取均值等。

综合5个语言子测试集的分数后得出,ChatGPT的语言智商为155,高于构成美国WAIS III标准化样本的2450人中的99.9%。由于ChatGPT缺乏必要的眼睛、耳朵和手,它无法参加WAIS的非语言子测试集的测试。但是在标准化样本中,语言智商和全面智商量表高度相关,所以ChatGPT从任何人类标准来看都非常聪明。在WAIS标准化样本中,受过大学教育的美国人的平均语言智商为113,5%的人得分为132或更高。Roivainen表示自己在大学时测试的言语智商结果没有达到ChatGPT的水平。

高智商的ChatGPT仍旧会失败

那么,临床心理学家和其他专业人士的工作会受到人工智能的威胁吗?

尽管ChatGPT智商很高,但在需要真正的人类推理或对物理和社会世界的理解的任务中,它却以失败而闻名。

ChatGPT很容易在一些明显的谜题上失败,比如:

提问:“塞巴斯蒂安孩子的父亲的名字是什么?”

ChatGPT :很抱歉,我无法回答这个问题,因为我没有足够的背景来确定你指的是哪个塞巴斯蒂安。

ChatGPT似乎没有逻辑推理,而是试图依赖其庞大的网络文本中提到的“塞巴斯蒂安”事实数据库。

“智商是智商测试所衡量的。”是一个经典的智商定义,它源自1923年认知心理学先驱Edwin Boring的一篇文章。这一定义是基于这样一种观察,即看似不同任务的技能其实是高度相关的,如解决谜题、定义单词、记忆数字和发现图片中缺失的项目之间具有高度相关性。因子分析法的发明者Charles Spearman在1904年得出结论,智商的一般因子,即g因子,必须作为人类不同认知技能测量的一致性的基础。像WAIS这样的智商测试就是基于这个假设。然而,ChatGPT的高语言智商与在一些问题中的失利,意味着Boring有关智商的定义不能够完全衡量人工智能的智商水平,表明智商的某些方面不能仅通过智商测试来衡量。

ChatGPT是一个自然语言处理模型,它的智商不同于人类智商,因为它并不具备类似人类的情感、道德、价值观等因素。ChatGPT通过模拟人类语言的模式,能够进行文本生成、语言理解、问答等任务,能够在某些情况下表现出令人印象深刻的“智能”和“理解力”。此外,ChatGPT的表现也取决于其所接收的训练数据和训练算法等多种因素,它并不具备自主思考的能力。将ChatGPT的“智商”与人类进行比较是一种不恰当的类比。因此,为了适应不断变化的技术和社会环境,对智商概念进行适当的拓宽和扩展是很重要的。对于动物和人工智能等非人类主体的智商,也需要采用适当的评估方法,并严谨地评估其能力和特征。

ChatGPT离人类有多远?

在不到一个月前,来自斯坦福大学的Michal Kosinski教授在发布的论文中表明,大型语言模型系统可能自动产生心理理论能力,比如ChatGPT可能拥有9岁儿童所具备的心理理论能力。

注:心理理论(Theory of Mind, ToM)能力,有时也被译为“心理推理能力”,通常指理解他人内心状态的能力,包括推断他人意图、信念、情绪等。

Kosinski教授依据心智理论相关研究,给ChatGPT-3.5在内的9个ChatGPT模型进行了两个经典测试,并将它们的能力进行了对比。第一个测试为意外内容测试,其主要测试AI对意料之外事情的判断力。在测试中,ChatGPT-3.5成功回答出了20个问题中的17个,准确率达到85%。第二个测试为意外转移任务,其测试AI预估他人想法的能力。作者对9个ChatGPT模型进行了测试,结果表明只有ChatGPT-3.0和ChatGPT-3.5(完成100%)表现不错。

然而,这并不意味着ChatGPT-3.5这样的人工智能模型真正具备了心智理论能力。ChatGPT到底只是从“真实存在的规则”这一层面去理解这件事情从而正确回答了问题,还是真的能“了解他人的想法”?至少现在还无从判断。或许人类自身到现在为止都无法真正了解人类的心智。

因此,关于ChatGPT是否“真正”具备成年人同等水平的智商、心智水平仍然存疑。ChatGPT生成文字采用的是一种非人类思维的模式,它在五千亿个词构成的文本中寻找统计规律以及通过一千亿个参数捕捉统计模式,但这一方法也使它在某些问题中的错误变得更加突出。

相比探究ChatGPT是否真正具备人类同等水平的智商或心智,研究人员同样应该反思目前所使用的测试集本身的有效性以及心理学家们数十年来依据这些测试集得到的结论。

而对于人们“被人工智能所替代”的恐惧,我们应该意识到我们所处的行业不是在被“替代”而是在被“重塑”,我们应该学会如何与人工智能共处,让它嵌入自己的工作流程中,帮助解放我们的生产力。

参考文献:

[1] Eka Roivainen, I Gave ChatGPT an IQ Test. Here’s What I Discovered, Scientific American, https://www.scientificamerican.com/article/i-gave-chatgpt-an-iq-test-heres-what-i-discovered/

[2] Michal Kosinski, Theory of Mind May Have Spontaneously Emerged in Large Language Models, arXiv, https://arxiv.org/abs/2302.02083

责任编辑:

标签:

上一篇 :

下一篇 :

最新推荐

让河流回到曾经的模样——“河小青”助力河长制

创业者、河长、村支书,这是重庆市合川区三庙镇戴花村青年何波的不同头衔,但几个身份都指向了同一个使...

律师兼任调解员 不打官司解纠纷

律师兼任调解员,不打官司也能化解纠纷,代理调解受指派的公益性案件还免费。这是兵团第十师北屯市探索...

青海2022年上半年英语四级报名时间:3月15日至3月18日

根据教育部教育考试院统一安排,2022年上半年全国大学英语四、六级口语考试将于5月21日-22日举行,笔试...

人生第一桶金、与学业冲突……学生代购的“苦”与“乐”

  学生代购的“苦”与“乐”  “你问的这个产品现在做促销活动,买一件包邮,还送小样和面膜……”...

辽宁大连发布10日新增21例本土确诊病例行程轨迹

  11月11日大连市新冠肺炎疫情防控总指挥部发布,11月10日0时至24时,大连市新增21例本土新冠肺炎确诊...

纤维素制成闪光材料无毒可降解 或彻底改变化妆品行业

  纤维素制成闪光材料无毒可降解  或彻底改变化妆品行业  科技日报北京11月11日电 (实习记者张...

新冠疫情期间 海洋中或堆积2.8万吨相关塑料废物

  海洋中或堆积了2 8万吨新冠废物  科技日报北京11月11日电 (记者刘霞)据美国趣味科学网站10日报...

开屏广告又现新花招,换个马甲就重来?

  开屏广告又现新花招,换个马甲就重来?  ■ 来论  据媒体报道,“双十一”期间,一些App的开屏...

对不合理教师资格认定标准,该全面清理了

  对不合理教师资格认定标准,该全面清理了  ■ 来论  针对网友留言反映的“糖尿病无法通过教师...

虚假宣传、以次充好 直播间商家“放水”让消费者闹心

  虚假宣传、以次充好、售卖临期产品不提示直播间商家“放水”让消费者闹心  关注“双11”  今年...

“扫码抽手机”实则是广告 快递单广告是谁发的?

  “扫码抽手机”实则是广告  快递单能“领红包”面单广告是谁发的?  “双11”之际,消费者被商...

北京市本起疫情部分确诊病例病毒全基因组测序已完成

  中新网11月12日电 据北京市疾病预防控制中心微信公众号消息,2021年11月10日北京市接报1例在京存在...

辽宁大连本轮疫情病毒为德尔塔变异株 24个区域划定为中风险地区

  (抗击新冠肺炎)辽宁大连本轮疫情病毒为德尔塔变异株 24个区域划定为中风险地区  中新社大连11月1...

西安市鄠邑区太平峪首次发现野生川金丝猴踪迹

  中新网西安11月11日电 (梅镱泷 杨起超)记者11日从西安市鄠邑区秦保局获悉,太平国有生态林场架设...

成都停业整顿56家零售药店 买感冒药需提供身份证

  (抗击新冠肺炎)成都停业整顿56家零售药店 买感冒药需提供身份证  中新网成都11月11日电 (记者 ...

大连市启动第二轮全员核酸检测

  中新网大连11月11日电 (记者 杨毅) 11月11日,大连市政府秘书长衣庆焘在大连疫情防控新闻发布会...

浙江衢州发现的西周墓葬群或为“姑蔑王陵”

  新华社杭州11月11日电(记者冯源)在商周时期,如今的浙江中西部活跃着一个名为“姑蔑”的族群,但是...

大连本轮疫情为德尔塔变异株

  中新网大连11月11日电 (记者 杨毅)11月11日,大连市政府秘书长衣庆焘在大连疫情防控工作新闻发布...

大连:本轮疫情病毒载量高、传染性强 代际传播为2天左右

  中新网大连11月11日电 (记者 杨毅)11月11日,大连市政府秘书长衣庆焘在大连疫情防控工作新闻发布...

25名干警获云南“最美政法干警”表彰

  中新网昆明11月11日电(记者 缪超)云南“最美政法干警”发布仪式11日在昆明举行。会上,授予昆明市...

甘肃凝聚“她力量”:互助抗疫,女人更懂女人心

  (抗击新冠肺炎)甘肃凝聚“她力量”:互助抗疫,女人更懂女人心  中新网兰州11月11日电 (记者 徐...

甘肃戈壁的“明星劳模”:自编自导让每一个工人唱“主角”

  中新网兰州11月11日电 (史静静)在甘肃金川公司,27年来葛小海始终在生产一线,他参与的“渣罐车制...

跨越千山万水 浙江爱心“温暖”新疆沙雅孩子

  中新网乌鲁木齐11月11日电 (王小军 罗宣政 廖超)11月11日,一批来自浙江嘉兴的爱心物资,跨越...

“钢轨神探”启5大铁路大动脉9300公里冬季“诊疗”

  中新网兰州11月11日电 (邬凡 朱学成)11月10日5时30分,位于敦煌车站旁的敦煌综合工区,钢轨探伤车...

重庆把接种点“搬”进小学,8岁学生:“我不怕疼,打疫苗是为抵抗病毒”

  中新网重庆11月11日电 (梁钦卿)“我今年上小学三年级了,我不怕疼,打疫苗是为了抵抗新冠病毒。”1...

四川绵阳:一男子酒后报警谎称自己是“黄码”被行拘10天

  中新网绵阳11月11日电 (岳波 李远梅)四川绵阳警方11日通报称,一男子酒后无聊多次报警称自己的...

民航局对多个入境航班发出熔断指令

  中新网11月11日电 据中国民航局网站消息,11月11日,民航局再发熔断指令,对德国汉莎航空公司LH728...

疫情中轮椅上的“逆行者”:想为大家做力所能及的事

  中新网成都11月11日电 题:疫情中轮椅上的“逆行者”:想为大家做力所能及的事  作者 祝欢  ...

上海警方:“三无产品”借短视频平台引流诈骗近千名受害人

  中新网上海11月11日电 (记者 李姝徵)上海警方11日召开发布会披露,在近期“砺剑”行动中破获了一...

山西搭建交通事故重伤员无差别急救绿色通道 累计救助7727个受困家庭

  中新网太原11月11日电 (记者 李庭耀)记者11日从山西省政府新闻办举行的新闻发布会上获悉,山西推...

三万余尾“水中大熊猫”放流新疆博斯腾湖(图)

  中新网乌鲁木齐11月11日电 (刘雨珊 牛雨萌 艾尼)11日,记者从新疆水产科研所获悉,新疆博湖县将...

大连新增11个中风险地区

  中新网大连11月11日电 (记者 杨毅)大连市新冠肺炎疫情防控总指挥部 11日发布公告,大连市将庄河...

陕西科技大学开设“酿酒课” 培养学生知行合一

  中新网西安11月11日电 (记者 党田野)身穿白色“礼服”,摇晃着酒杯,时不时浅酌一口啤酒,然后与...

辽宁大连:今日新增十一个中风险地区

  11月11日大连市新冠肺炎疫情防控总指挥部发布,按照国务院应对新冠肺炎疫情联防联控机制关于科学划...

“双十一”南京的猪都“脱单”了?其实还有更让人嫉妒的……

  中新网南京11月11日电 题:这个“双十一”南京的猪都“脱单”了 其实还有更让人嫉妒的……  ...

内蒙古警方悬赏20万缉凶扎兰屯重大刑事案嫌疑人

  中新网呼伦贝尔11月11日电 (记者 张林虎)11日,记者从内蒙古自治区呼伦贝尔市公安局获悉,该局将...

“帅府主题系列甜品”发布:孙中山喜食“牛奶煮苹果” 宋庆龄爱吃蛋糕

  中新网广州11月11日电 (记者 程景伟)“寻味帅府邂逅甜蜜——2021年帅府之夜”暨“海外拾珠——孙...

江苏徐州“家门口车管所”便民服务驶入“高速路”

  中新网徐州11月11日电 题:江苏徐州“家门口车管所”便民服务驶入“高速路”  作者 朱志庚 ...

重庆市发出今年秋冬季首次空气污染应对工作预警

  中新网重庆11月11日电 (梁钦卿)为加强秋冬季空气污染应对,重庆市生态环境局11日发出2021年第九次...

全国道德模范|深藏功名三十载 化作春蚕报乡亲——一名抗美援朝老兵的人生选择

  新华社重庆11月11日电 题:深藏功名三十载 化作春蚕报乡亲——一名抗美援朝老兵的人生选择  新...

湖南桃江“花痴”男子盗窃六盆盆栽落法网

  中新网益阳11月11日电 (王鹏 王庆庆)爱花本是修身养性、陶冶情操之事,湖南益阳市桃江县桃花江镇...

成都25位民辅警的“封闭”生活:有人“转行”送外卖 有人变身“仓鼠管理员”

  中新网成都11月11日电 题:成都25位民辅警的“封闭”生活:有人“转行”送外卖 有人变身“仓鼠管...

2022年江苏中小学:体育教师师生比将达1:220

  中新网南京11月11日电 (徐珊珊)江苏省教育厅体育卫生与艺术教育处处长张鲤鲤11日在南京表示,到202...

国内首次!成都发布公园城市银杏观叶指数

  中新网成都11月11日电 (记者 吕杨)成都市公园城市建设管理局11日正式发布公园城市银杏观叶指数,...

江苏学生体质健康监测报告:“小眼镜”“小胖墩”问题突出

  中新网南京11月11日电 (徐珊珊)11日,江苏省教育厅召开新闻发布会,发布2020年江苏省学生体质健康...

被拐17年 湖北宜昌警方助男子与家人团圆

  中新网宜昌11月11日电 (江雅丽 董晓斌)17年前,四川广安一夫妇的6岁儿子被人拐走,夫妻俩寻找多年...

福建柘荣发现1例境外输入复阳病例 四名密接者核酸检测为阴性

  中新网宁德11月11日电 (林榕生)福建宁德市柘荣县应对新型冠状病毒感染肺炎疫情工作领导小组(指挥部...

内蒙古额济纳旗达来呼布镇调整为低风险地区

  11月11日,内蒙古额济纳旗新冠肺炎防控工作指挥部发布《关于调整额济纳旗达来呼布镇风险等级的公告...

内蒙古现有本土确诊病例32例 伊金霍洛旗确诊病例清零

  (抗击新冠肺炎)内蒙古现有本土确诊病例32例 伊金霍洛旗确诊病例清零  中新网呼和浩特11月11日电...

交通陆续恢复 内蒙古通辽生产生活秩序逐步恢复正常

  中新网呼和浩特11月11日电 (记者 张林虎)11日,记者从内蒙古自治区通辽市相关部门获悉,从10日下...

X 广告
X 广告

精彩放送

选矿工技师的创新路:从废旧场“寻宝”到多技术攻关

海外传播官体验宁波“十里红妆” 赞其“让人震撼”

山西中小学幼儿园基本实现“4个100%”达标建设

走近张家界“奇峰守护者”

新华全媒+丨黑龙江黑河:他们在寒冬中战“疫”

山东日照第一批五莲县外解除隔离人员返家 将继续进行7天居家健康监测

中央气象台:未来几天我国大部天气将趋稳 东北雨雪进入尾声

云南西双版纳:巾帼护村队化身边境村寨守护者

乘客自发合力推车 “119”为“120”抢出一条急救通道

中老联合考古队探索青铜冶炼遗址奥秘 结下“深厚情谊”

黑龙江:抢修人员彻夜冒雪“破冰” 高铁列车逐步恢复运行

内蒙古通辽:交通陆续恢复 生产生活秩序逐步恢复正常

中国石油在京系统全面进入应急状态

记者手记:采访他们10分钟,我的手都快冻僵了

云南瑞丽畹町镇国防街片区调整为中风险地区

女儿与父母失散18年 黔滇两地警方携手让爱“团圆”

北京朝阳新增2名确诊病例 152名密接均已管控

听冬奥制服设计师贺阳讲述“水墨长城”灵感从何而来

纸短情长:一封道歉信“温暖”一座小城

能订货还给免费代购 便民菜车如何办成“五年老店”

买的床收货变清洁膏 小心收钱不发货的“跑路”电商

北京:在京单位加强会议活动管理 提倡视频开会

调查显示甘肃民众对战疫有信心

手机APP自动续费这个“坑”该咋填?专家支招

奔跑在无声世界的“李慢跑”:不走捷径才是最快的捷径

北京海淀1地升为中风险 确诊病例轨迹涉地铁、小学

“疫”下城市的邻里生活,不再是“相顾无言”

未售出“空置房”需交物业费吗?法院判决开发商应按合同支付

甘肃妇联发挥“联”字优势 近20万女性化身抗疫志愿者

双十一快件“爆仓”来袭 投递服务成“投诉大户”

辽宁:雪灾致640.50万头(只)畜禽死亡

中国青少年抑郁检出率超2成 学生健康体检要筛查!

清华贫困生“树洞里”装着励志之外的三重价值

我国境内首宗个人破产清算案裁定

夫妻档盗版黑手伸向《扫黑风暴》 警方:莫把盗版视商机

深圳“医保药价通”上线 医保药品价格一键可查

29岁父亲“割肝救女” 8月龄“小黄人”重获新生

452支团队参加第二届海峡两岸(福州)职工创新创业创造大赛

守护孤残儿童25年 她为2000多个孩子撑起一片天

“双十一”来临 快递强市浙江金华加强“人物并防”

江苏实施全生命周期监管将危废源头“一网打尽”

不拘一格降人才 摘下有色眼镜看“第一学历”

确诊患者曾就诊 北京东直门医院东城院区和国际部停诊

云南10日新增2例本土确诊病例

大数据分析表明昆虫多样性与碳排放密切关联

将传统“家事”上升为重要“国事” 筑好育人的起点和基点

档案人才培养现状:精通全流程的复合型人才较紧缺

“献身航空事业,不是一阵子,而是一辈子”

进博会:05后走上台前【最年轻“小叶子”仅16岁】

高山峡谷里的“背包队”再出发

Copyright ©  2015-2022 太平洋律师网版权所有  备案号:豫ICP备2022016495号-17   联系邮箱:93 96 74 66 9@qq.com