狗狗也有方言,当AI开始翻译动物语言
狗狗也有方言,当AI开始翻译动物语言
狗狗也有方言,当AI开始翻译动物语言界面新闻记者 | 丁欣雨
界面新闻编辑(biānjí) | 姜妍
你想了解猫咪(māomī)发出咕噜咕噜的响声、小狗一直舔人是什么含义吗?数字技术正在帮助人类(rénlèi)实现跨物种交流的可能。
根据本月由国家知识产权局发布的一份专利文件,百度拟定开发一种能破译动物交流方式的系统,利用收集到的声音(shēngyīn)、动作数据,经人工智能识别(shíbié)出情绪状态结果(jiéguǒ)后,再映射到语义含义(hányì)中,翻译成人类语言。
而在国外(guówài)类似的研究正在如火如荼进行中,在今年世界海豚日(4月14日)前后,谷歌也发布了一款即将(jíjiāng)在夏天开源的“DolphinGemma”AI大模型,称其能(chēngqínéng)与(yǔ)海豚实现水下实时交流,并对它们(tāmen)的后续(hòuxù)声音序列进行预测。这种高智商的社会化物种会在从鼻腔喷出空气时发出尾音音节(coda)声来彼此交流,就像人类使用摩斯密码一样。
和(hé)海豚同属鲸类的鲸鱼们的语言同样在被研究,近期在《Nature》发表的一项研究,就是利用人工智能梳理了鲸鱼近9000个(gè)尾音(wěiyīn),发现(fāxiàn)了其内含的新特征——“弹性伸缩(rubato)”和“装饰音(zhuāngshìyīn)(ornamentation)”,鲸鱼会根据对话语境,采用在弹性伸缩、装饰音与稳定节拍间组合变换的方式,创造出独特尾音。研究人员(rényuán)更因此提出了一种(yīzhǒng)类似于我们国际音标的“抹香鲸音标”。
几十年来,鲸类动物的(de)语言一直是自然声学研究的重中之重,这既源自对于其他物种的探索冲动,还有更加切实的诉求。1970年,美国生物学家罗杰·佩恩录制了一张全程只有海浪背景下鲸鸣声的音乐专辑《座头(zuòtóu)鲸之歌》,销量(xiāoliàng)超过10万张,并激发“拯救鲸鱼(jīngyú)”国际运动(yùndòng)的发生,最终阻止了多种海洋哺乳动物的灭绝。

图源:unsplash
而在当下,“鲸类翻译计划(CETI)”和纽约大学法学院超人类生命项目(MOTH)也试图(shìtú)借鲸类动物(lèidòngwù)声音研究来促进动物新权利(quánlì)的(de)诞生,影响法律裁决。他们发表在《生态法季刊》上的一篇文章指出,了解鲸类交流的复杂性和具体内容,能揭示其在船舶交通、石油勘探和深海采矿等人类活动产生的水下噪音中受到的痛苦与(yǔ)折磨。
在反对赋予(fùyǔ)动物权利的(de)论点中,语言被认作是人类独有的特征。世界各地的土著社群早已意识到动物有自己的交流方式,而(ér)西方科学(kēxué)界则习惯完全否定动物交流的概念,他们更(gèng)倾向于注重视觉而非听觉,觉得人类无法观察到的事物就不存在。而这门科学利于打破这种固定思维,也(yě)能更好地与土著群体对于鲸类动物的知识传统相融合。在他们眼中(yǎnzhōng),鲸鱼承载一种古老的神圣精神(jīngshén),把万物凝聚起来,2024年,新西兰、塔希提岛和库克群岛就曾签署一项“海洋宣言”,承认鲸鱼具有法人地位。
与动物交流的创想在(zài)国外也落实到(dào)了宠物领域,全球首个人宠翻译器Traini在2024年底于iOS程序推出,这款主要用来理解“狗狗(gǒugǒu)语”的软件由一个华人团队(tuánduì)进行开发,依靠其自主(zìzhǔ)研发的PEBI(宠物情绪与行为(xíngwéi)智能)模型,收集主要来自(láizì)北美和欧洲区域应用平台上的用户社区信息(xìnxī),目前覆盖了120个不同的狗狗品种,能够检测12种情绪,包括快乐、恐惧等基本情绪和其之外的细微感受。用户只要上传相关的声音、图片和视频,就能实现翻译,且官方(guānfāng)数据显示准确率高达至81.5%。反过来,Traini也能把用户的话语例如“看我”“一起走”转换成犬吠,传递给狗狗。
Traini的CEO孙邻家近期接受一条采访时表示,狗狗拥有(yōngyǒu)的语言表达功能受到(shòudào)其心智程度、社会化进程、品种和生活地区的影响而呈现差别。比如“边牧学(biānmùxué)得更快,词汇量就会更大”;而由于(yóuyú)“狗狗也有方言”,这个主要面向(miànxiàng)英文用户的AI原生应用,听不懂中国狗的情况也会出现。“当然还有一种可能,就是狗狗听懂(tīngdǒng)了,但是不想做。就像一个小孩子在打游戏,你跟他(tā)说去做作业,小孩听懂了,但他就是不想。”

社交媒体截图
就(jiù)如几百年前显微镜的发明拓展了人类视觉所能(suǒnéng)触达的极限那样,人们也在依靠(yīkào)AI开启一个全新的声音世界。用科技记者艾德·永(yǒng)(Ed Yong)的话来说,当意识到(dào)动物(dòngwù)声音也享有一套历史性的、社会性的互动代码,那些人类独有的权利也将有可能扩展到非人类动物上,同时丰富所谓“语言”的包容性定义、重新审视人与自然的关系。
《听不见的(de)大自然:博物学家的自然聆听笔记》一书的作者(zuòzhě)、牛津大学环境地理学博士凯伦·巴克还提醒我们注意,物种间的交流声也(yě)能间接反映气候变化的问题,例如非洲大草原上鸟类和其他物种经常在黎明或黄昏时刻进行合唱,是由于这些(zhèxiē)时刻空气湿度较高,声音也能传播得更远、更快。但随着大气温度和湿度受到影响,它们在更干燥和炎热的环境中更难正常交流。失去相互警告威胁和找到配偶(pèiǒu)的机会,动物的安全性也会降低(jiàngdī),最终影响到它们的繁衍和生存(shēngcún)。

[加] 凯伦·巴克 著 邓婧文 译北京科学技术出版社 2024-3
人工智能实现的跨物种交流,“既能用来引发更深层次的亲密感,也(yě)可能用来培养一种支配感和操控能力,从而驯化人类以前从未控制过的野生物种。”巴克称,德国(déguó)的一个(yígè)研究(yánjiū)小组将蜜蜂信号编码(biānmǎ)到一个机器人当中,把它送到蜂巢里,机器人能利用(lìyòng)蜜蜂的摇摆舞交流,指示蜜蜂停止移动,并飞往特定的花蜜源。研究的下一阶段(xiàyījiēduàn)会将机器人植入蜂巢,让蜜蜂从一开始就接纳这些机器人,把它们(tāmen)视作群体的一员。“这样一来,我们将对蜂巢拥有前所未有的控制,而且动物在军事上的使用由来已久,我觉得这会是一条值得警惕的路径。”

界面新闻记者 | 丁欣雨
界面新闻编辑(biānjí) | 姜妍
你想了解猫咪(māomī)发出咕噜咕噜的响声、小狗一直舔人是什么含义吗?数字技术正在帮助人类(rénlèi)实现跨物种交流的可能。
根据本月由国家知识产权局发布的一份专利文件,百度拟定开发一种能破译动物交流方式的系统,利用收集到的声音(shēngyīn)、动作数据,经人工智能识别(shíbié)出情绪状态结果(jiéguǒ)后,再映射到语义含义(hányì)中,翻译成人类语言。
而在国外(guówài)类似的研究正在如火如荼进行中,在今年世界海豚日(4月14日)前后,谷歌也发布了一款即将(jíjiāng)在夏天开源的“DolphinGemma”AI大模型,称其能(chēngqínéng)与(yǔ)海豚实现水下实时交流,并对它们(tāmen)的后续(hòuxù)声音序列进行预测。这种高智商的社会化物种会在从鼻腔喷出空气时发出尾音音节(coda)声来彼此交流,就像人类使用摩斯密码一样。
和(hé)海豚同属鲸类的鲸鱼们的语言同样在被研究,近期在《Nature》发表的一项研究,就是利用人工智能梳理了鲸鱼近9000个(gè)尾音(wěiyīn),发现(fāxiàn)了其内含的新特征——“弹性伸缩(rubato)”和“装饰音(zhuāngshìyīn)(ornamentation)”,鲸鱼会根据对话语境,采用在弹性伸缩、装饰音与稳定节拍间组合变换的方式,创造出独特尾音。研究人员(rényuán)更因此提出了一种(yīzhǒng)类似于我们国际音标的“抹香鲸音标”。
几十年来,鲸类动物的(de)语言一直是自然声学研究的重中之重,这既源自对于其他物种的探索冲动,还有更加切实的诉求。1970年,美国生物学家罗杰·佩恩录制了一张全程只有海浪背景下鲸鸣声的音乐专辑《座头(zuòtóu)鲸之歌》,销量(xiāoliàng)超过10万张,并激发“拯救鲸鱼(jīngyú)”国际运动(yùndòng)的发生,最终阻止了多种海洋哺乳动物的灭绝。

而在当下,“鲸类翻译计划(CETI)”和纽约大学法学院超人类生命项目(MOTH)也试图(shìtú)借鲸类动物(lèidòngwù)声音研究来促进动物新权利(quánlì)的(de)诞生,影响法律裁决。他们发表在《生态法季刊》上的一篇文章指出,了解鲸类交流的复杂性和具体内容,能揭示其在船舶交通、石油勘探和深海采矿等人类活动产生的水下噪音中受到的痛苦与(yǔ)折磨。
在反对赋予(fùyǔ)动物权利的(de)论点中,语言被认作是人类独有的特征。世界各地的土著社群早已意识到动物有自己的交流方式,而(ér)西方科学(kēxué)界则习惯完全否定动物交流的概念,他们更(gèng)倾向于注重视觉而非听觉,觉得人类无法观察到的事物就不存在。而这门科学利于打破这种固定思维,也(yě)能更好地与土著群体对于鲸类动物的知识传统相融合。在他们眼中(yǎnzhōng),鲸鱼承载一种古老的神圣精神(jīngshén),把万物凝聚起来,2024年,新西兰、塔希提岛和库克群岛就曾签署一项“海洋宣言”,承认鲸鱼具有法人地位。
与动物交流的创想在(zài)国外也落实到(dào)了宠物领域,全球首个人宠翻译器Traini在2024年底于iOS程序推出,这款主要用来理解“狗狗(gǒugǒu)语”的软件由一个华人团队(tuánduì)进行开发,依靠其自主(zìzhǔ)研发的PEBI(宠物情绪与行为(xíngwéi)智能)模型,收集主要来自(láizì)北美和欧洲区域应用平台上的用户社区信息(xìnxī),目前覆盖了120个不同的狗狗品种,能够检测12种情绪,包括快乐、恐惧等基本情绪和其之外的细微感受。用户只要上传相关的声音、图片和视频,就能实现翻译,且官方(guānfāng)数据显示准确率高达至81.5%。反过来,Traini也能把用户的话语例如“看我”“一起走”转换成犬吠,传递给狗狗。
Traini的CEO孙邻家近期接受一条采访时表示,狗狗拥有(yōngyǒu)的语言表达功能受到(shòudào)其心智程度、社会化进程、品种和生活地区的影响而呈现差别。比如“边牧学(biānmùxué)得更快,词汇量就会更大”;而由于(yóuyú)“狗狗也有方言”,这个主要面向(miànxiàng)英文用户的AI原生应用,听不懂中国狗的情况也会出现。“当然还有一种可能,就是狗狗听懂(tīngdǒng)了,但是不想做。就像一个小孩子在打游戏,你跟他(tā)说去做作业,小孩听懂了,但他就是不想。”

就(jiù)如几百年前显微镜的发明拓展了人类视觉所能(suǒnéng)触达的极限那样,人们也在依靠(yīkào)AI开启一个全新的声音世界。用科技记者艾德·永(yǒng)(Ed Yong)的话来说,当意识到(dào)动物(dòngwù)声音也享有一套历史性的、社会性的互动代码,那些人类独有的权利也将有可能扩展到非人类动物上,同时丰富所谓“语言”的包容性定义、重新审视人与自然的关系。
《听不见的(de)大自然:博物学家的自然聆听笔记》一书的作者(zuòzhě)、牛津大学环境地理学博士凯伦·巴克还提醒我们注意,物种间的交流声也(yě)能间接反映气候变化的问题,例如非洲大草原上鸟类和其他物种经常在黎明或黄昏时刻进行合唱,是由于这些(zhèxiē)时刻空气湿度较高,声音也能传播得更远、更快。但随着大气温度和湿度受到影响,它们在更干燥和炎热的环境中更难正常交流。失去相互警告威胁和找到配偶(pèiǒu)的机会,动物的安全性也会降低(jiàngdī),最终影响到它们的繁衍和生存(shēngcún)。

人工智能实现的跨物种交流,“既能用来引发更深层次的亲密感,也(yě)可能用来培养一种支配感和操控能力,从而驯化人类以前从未控制过的野生物种。”巴克称,德国(déguó)的一个(yígè)研究(yánjiū)小组将蜜蜂信号编码(biānmǎ)到一个机器人当中,把它送到蜂巢里,机器人能利用(lìyòng)蜜蜂的摇摆舞交流,指示蜜蜂停止移动,并飞往特定的花蜜源。研究的下一阶段(xiàyījiēduàn)会将机器人植入蜂巢,让蜜蜂从一开始就接纳这些机器人,把它们(tāmen)视作群体的一员。“这样一来,我们将对蜂巢拥有前所未有的控制,而且动物在军事上的使用由来已久,我觉得这会是一条值得警惕的路径。”

相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎