学术界推出了一个新的测试模式叫“逆向起源”,想通过它来重新看看智能到底是啥,还有文明到底是个什么标准。现在的智能技术发展得太快了,怎么科学地给“智能”下个定义,成了各个学科都在操心的事儿。最近,上海财经大学人文学院的院长王献华在一次公开演讲里,从人类文明是怎么来的这个角度出发,提了个叫“Nigiro Challenge”的测试方案,给智能评估体系里加了不少人文和社会方面的想法。问题是:传统的测试有些跟不上趟子自从中世纪图灵提出图灵测试以来,能不能通过自然语言跟人聊天、模拟人的行为,一直被当成机器有没有智能的大标准。不过技术变来变去的,好些系统都自称过了这关,这也让人们越来越怀疑它到底靠不靠谱。王献华觉得,图灵测试本质上更像是在考验提问题的人水平高低,不是真正在检验机器有多聪明。这种照着镜子的逻辑,根本没法摸到智能里的社会性、创造力和文化生产能力这些核心东西,所以急需补充一套更有结构的评估框架。为什么会这样?因为智能跟社会文明是分不开的王献华从人类文明发展史看起,强调智能不是自己跑出来的,是在大家互动、文化创造中慢慢长成的。文字发明被当成人类智能的重要一步,它不光是个装信息的东西,还是集体思维、协作还有文明积累下来的产物。基于这个道理,“Nigiro Challenge”把测试重点放在了“虚拟造字”上,让智能体在聊天环境里自己搞出文字系统来。这样设计是为了看看它有没有符号生成、意思商量还有文化搭架子的本事,这些都是人类智能的大本事。这事儿有啥影响?会让评估智能的哲学基础变一变这个测试方案的出现,意味着评估智能的路子从光模拟人变成了考创造力验证。它逼着大家再想想智能到底是啥:是不是该包含文化创造还有社会融合这些维度?王献华还说,如果有一群智能体能自己发明文字,就算是有资格加入人类文明的对话了。这个观点不光把智能的理论边界给扩大了,也给以后人和机器一起干活、一起生活提供了点伦理学和哲学上的参考依据。咋办?得建一个多维度的评价体系面对技术跑得这么快,光靠一个测试肯定不够用了。学界应该推动弄出个把技术、人文和社会科学都糅合在一起的综合评价体系,除了看功能行不行,还得算上文化适应力、有啥创造的成果还有能不能融入社会这些指标。“Nigiro Challenge”作为一种补充的测试思路,可以跟别的办法互相参照,一块儿弄出个更立体更严实的判断标准。未来咋样?研究和对话要迈上新台阶从学着像人到参与文明创造,智能技术现在算是到了深水区了。以后跨学科的合作要是深了,测试会更看重它在真社会场景里能玩到一起还有能有啥创造贡献。不管技术怎么变着法儿跑,人对智能本质的追问其实就是在问自己对自己文明的看法和守护怎么样。智能的衡量从来都不是光算技术账的事儿,更是个文明的大题目。科技跑得正欢的时候,咱们得回到人类智能的老根上看看文化根基在哪头去。这可能就是咱们保持清醒、找准未来方向的一个重要锚点吧。只有在不断创造和对话里反思智能到底是啥样的,才能让人跟机器一起生活的路走得稳当、长远点。