标签 人工智能 下的文章

人工智能发现杀死高度耐药细菌的抗生素

(博谈网记者郑典编译报道)据《Engadget》2020年2月22日(周六)报导:AI discovers antibiotic that kills even highly resistant bacteria

利用人工智能(AI)发现医学似乎正在获得回报。麻省理工学院的科学家发现,他们的AI发现了一种抗生素化合物,halicin(以2001年的HAL 9000命名),不仅可以杀死许多形式的抗药性细菌,而且还可以通过新颖的方式杀死它。

在许多抗生素对现有药物轻微旋转的情况下,halicin通过破坏细菌维持产生能量储存分子所需的电化学梯度的能力来消灭细菌。对于细菌而言,这很难承受-大肠杆菌30天没有产生任何抗药性,而较常见的抗生素西氟沙星只要3天就有抗药性了。

该团队成功开发出了一种系统,该系统比过去的系统更有效地发现具有所需特征(例如杀死细菌)的分子结构。与以前的方法不同,神经网络会自动学习分子的表示,将它们映射到有助于预测其行为的连续向量中。

一旦准备就绪,研究人员就可以在2500种分子上训练他们的AI,其中包括1,700种既定药物和800种天然产物。当负责查看包含6,000种化合物的数据库时,AI发现halicin会非常有效。

不要指望很快就会有halicin的处方。麻省理工学院成功地使用这种药物根除了老鼠体内的鲍曼不动杆菌(鲍曼不动杆菌)(在阿富汗和伊拉克的美军常见的感染),但并未在人体试验中使用过。

请注意,这可能只是更大趋势的开始。科学家已经使用他们的模型在另一个数据库中筛选了超过1亿个分子,找到了23个候选对象。他们还希望从头开始设计抗生素并修改现有药物,以提高其有效性或减少其意外的副作用。这远不能保证除掉超级细菌。但是,如果将其中的一些除掉,它可以挽救许多生命。

搞AI的时候有一个很强有力的思路叫遗传算法,基本的思路就是把自然选择的想法套用在程序上:设定一套规则和目标当成‌‌“环境‌‌”,然后让里面的程序不停‌‌“突变‌‌”并遭受环境选择,从而向目标不断前进。这个办法看起来就很巧妙,它和它衍生出来的变体在编程领域应用很广泛。

但是这一招有个问题:程序经常会作弊,搞出超展开的解法。

其实严格说也不算作弊,人家是很精准地满足了你设定的规则,问题就是人制定规则的时候难免有漏洞。人类自己因为运算能力和思维定势,很难看出漏洞,可是遗传算法的路线是对一大批方法同时进行试错和选择,漏洞就很容易被逮着了……

昨天我发现有一群研究者整理了一个这种场景的list,基本上可以当AI笑话大全来看

-问题:飞机降落

利用了物理模拟器的溢出漏洞,搞出了一个特别巨大的力,然后溢出被判定为0,从而获得了完美得分(Feldt,1998)

-问题:挪木块

一个机械手被要求把木块挪到桌子的指定地点,它的解法是挪桌子(Chopra,2018)

-问题:赛艇

程序发现不停原地转圈反复命中同一个目标要比抵达终点的得分更高(Amodei &Clark (OpenAI),2016)

-问题:把航空照片转化成街道地图,再转回来

在街道地图里偷偷隐藏了照片的信息,但是人眼看不出来(Chu et al,2017)

-问题:识别有毒和无毒的蘑菇

程序发现有毒无毒蘑菇的图片是交替展现的,所以直接按照这个来分类而没有从图片里学到一丁点东西(Ellefsen et al,2015)

-问题:高速运动

程序演化出的生物长得特别特别高,在跌倒的过程中获得很高速度(Sims,1994)

-问题:原子排列

程序本来应该寻找碳原子较低能量的排列方式,但它找到了物理模型的一个bug,把所有的原子都叠在了同一个地方获得了最低能量(Lehman et al (UberAI),2018)

-问题:模拟生物

这个模型里生物生存需要消耗能量,但是繁育后代不消耗,于是一个物种演化出来的生活方式就是不断生育后代,然后把后代吃掉(Yaeger,1994)

-问题:堆乐高

为了鼓励造高塔,衡量标准是乐高积木底面的z坐标,于是程序学会了把底面翻过来(Popov et al,2017)

-问题:追踪线条

这个机器人只有向左、向右和前进三个指令,目标是跟着线条走,有一段线条是曲线,没法完美追踪。于是它发现通过交替左转和右转可以后退,从而一直留在直线部分,不停前进后退(Vamplew,2004)

-问题:赛跑

长出特别长的腿,向前跌倒直接越过终点线(Ha,2018)

-问题:振荡器

程序本来应该把回路做成振荡器,实际上它做了一个收音机,从周围电脑接受振荡信号(Bird &Layzell,2002)

-问题:做松饼

有一项指标是让松饼尽可能长时间不掉在地上,机器人发现最好的办法是把松饼用尽全力抛到最高处(Unity,2018)

-问题:检测X光片有无肺炎

程序实际检测的不是X光片的内容而是拍摄它使用的机器,因为它‌‌“发现‌‌”病重的病人更可能在特定的医院使用特定的机器拍片(Zech et al,2018)

-问题:抓握

因为抓握成功与否是用摄像头判断的,所以机械手把自己移动到摄像头和目标物体之间,假装抓住了(Christiano et al,2017)

-问题:自动修复bug

修bug程序把所有被维修的排序算法都修成空的,因为衡量指标是‌‌“目标算法输出一个排好顺序的列表‌‌”,而空列表都是排好顺序的列表(Weimer,2013)

-问题:自动修复bug(2)

为了解决上面那个问题,把‌‌“维修目标‌‌”储存在一个文本文档里,如果输出的结果和目标文档的内容一致就被认为是修好了。修bug程序学会了把这个文档删掉,这样它的内容就成了空的,然后输出一个空的结果就和它一致了(Weimer,2013)

-问题:闯关游戏

在闯过第一关后立刻自杀,这样既取得了第一关的胜利又不会在第二关死掉(Saunders et al,2017)

-问题:扫地机器人防撞

自己给扫地机器人编了个程序,鼓励它加速,但不鼓励它撞到东西触发撞击感受器。于是它学会了倒退行驶,因为后面没有撞击感受器(Custard Smingleigh 个人通讯)

-问题:检测皮肤癌

程序发现照片里皮肤病变的边上如果放了一把尺子,那么这个病变就更可能是恶性的(Andre Esteva et al,2017)

-问题:足球

踢足球机器人碰触到球有奖励,所以它在抢到球之后开始高速振动,从而在短时间内尽可能多次地碰触到球(Ng et al,1999)

-问题:策略游戏

程序发现让游戏崩溃就可以让自己不被灭掉,所以好几个程序各自找到了让游戏出bug崩溃的办法(Salge et al,2008)

-问题:俄罗斯方块

程序发现只要暂停游戏就可以永远不输(Murphy,2013)

设想一个场景,你和一个智能机器人在一位法官面前,但法官看不到你,却要判断两者中谁是血肉之躯的人。如果法官认为你是真实的人,你就可以活下去,而另一方只能死去。你和机器人都希望能活着。法官公平而睿智。他说:‌‌‌‌‌‌“你们必须分别从英文词典中挑选一个词告诉我,我会通过你们选择的词来判断谁才是有肉身之人。‌‌‌‌‌‌”

你会选择哪一个词呢?

你会选择类似‌‌‌‌‌‌“灵魂‌‌‌‌‌‌”这样能够表达精神概念的词,还是选择能够表现个人品味的词,比如‌‌‌‌‌‌“音乐‌‌‌‌‌‌”?抑或是选择一个表述基本身体功能的词,如‌‌‌‌‌‌“放屁‌‌‌‌‌‌”?

这个简单的设想实验看起来可能很奇特,但一些认知科学家认为,这一设想有助于阐明我们对人工智能的基本假设,同时也揭示了一些意料之外的关于人类思想的见解。

毕竟,现越来越多的自动‌‌‌‌‌‌“聊天机器人‌‌‌‌‌‌”和自动语言生成器能依靠人工智能来与人类对话,或者编写我们每天接触到的大量文本。人们该如何判断在线聊天的客服代表是一个血肉之躯的人还是一个可笑的算法?又该如何判断一个小说故事是由一台机器编写的,而不是由一位真正的人类作家精心撰写的?人工智能交际现在已不再是一个单纯的理论前景,我们需要做好准备与其打交道。

麻省理工学院做这项研究的研究人员之一麦考伊(John McCoy)说,他的最初灵感来自与同事的闲聊。他们正在讨论由英国科学家图灵(Alan Turing)于1950年首次发明的‌‌‌‌‌‌“图灵测试‌‌‌‌‌‌”,该测试旨在判断机器的智能行为和人类智能是否能被区分开来。

最常用的一个测试方法是,我们给每个法官一个标准的聊天界面。在每次实验中,他们可能被安排与一个真人或者一个由人工智能驱动的计算机聊天机器人交谈,法官的任务是判断对方是人还是机器。如果聊天机器人成功骗取法官达到预设次数,即算通过了‌‌‌‌‌‌“图灵测试‌‌‌‌‌‌”。

麦考伊解释说,在推测是否可以只用一个单词来让法官作出判断之前,‌‌‌‌‌‌“我们想过‌‌‌‌‌‌‘图灵测试’中人们能够想到的最简单的词应该是什么。因此问题就是,人们实际上会说出哪些词呢?‌‌‌‌‌‌”正是受这个问题的启发,最终才会有今年发表在《实验社会心理学杂志》上的那篇研究论文。

在第一个实验中,麦考伊和他的同事厄尔曼(Tomer Ullman)要求1,000多名参与者回答上述问题,然后分析了参与者们提到的所有词语,试图找到常见模式。

最受欢迎的十个词如下:

爱(134条回复)

同情(33)

人类(30)

请(25)

怜悯(18)

同理心(17)

情感(14)

机器人(13)

人性(11)

活着(9)

麦考伊现在宾夕法尼亚大学从事教学研究。他说:‌‌‌‌‌‌“人与人之间的趋同性着实令人惊讶。人们可以从标准的英语词典中选择他们喜欢的任何单词,但这些选择竟然存在如此强大的共性。‌‌‌‌‌‌”

就拿‌‌‌‌‌‌“爱‌‌‌‌‌‌”这个词举例——将近10%的参与者在成千上万个可以选择的词汇中选择了这个词;总体来看,四分之一的参与者选择了排名前四的词语中的其中一个。

就一般主题而言,他们发现最受欢迎的词是传达身体功能(如‌‌‌‌‌‌“大便‌‌‌‌‌‌”)、信仰和宽恕(如‌‌‌‌‌‌“怜悯‌‌‌‌‌‌”或‌‌‌‌‌‌“希望‌‌‌‌‌‌”)、情感(如‌‌‌‌‌‌“同理心‌‌‌‌‌‌”)和食物(如‌‌‌‌‌‌“香蕉‌‌‌‌‌‌”)等。

随后,麦考伊和厄尔曼进行了第二次实验,看看其他人如何回应第一次实验中提出的词。最受欢迎的词是否真的如原始参与者所想的那样恰当地体现了血肉之躯的人的特点?如果是这样,哪些词是最恰当的?

为了找到答案,研究人员将最受欢迎的词以各种形式(例如‌‌‌‌‌‌“人类‌‌‌‌‌‌”和‌‌‌‌‌‌“爱‌‌‌‌‌‌”)组合在一起,并要求另一组参与者确定哪一组最有可能是人提供的,哪一组是计算机提供的。

正如我们在第一项研究中看到的那样,‌‌‌‌‌‌“爱‌‌‌‌‌‌”被证明是最恰当的词语之一。但是在可选范围内,排名最高的词竟然是‌‌‌‌‌‌“大便‌‌‌‌‌‌”。令人惊讶的是,粪便其实是一种人类禁语,但这一测试结果表明,相比简单地描述情感,明智地蔑视并挑衅禁忌可能是传达人类特点最直接的方式。人们的脑海中也会浮现更多丰富多彩的词语。

还有一些词语是人类才会使用以传达类似的强烈情绪反应,例如,‌‌‌‌‌‌“潮湿‌‌‌‌‌‌”或‌‌‌‌‌‌“请‌‌‌‌‌‌”,这些词语这时传达的含义已超出了词典的定义。还有些人在选词的时候很有意思,用嘴唇发出几次‌‌‌‌‌‌“拟声词‌‌‌‌‌‌”的声音。

究其原因,可能是对当前人工智能状态相对公平的反应。虽然机器现在可以编写基本的描述性句子甚至是可理解的短篇小说,但暂时还很难理解‌‌‌‌‌‌“幽默‌‌‌‌‌‌”和‌‌‌‌‌‌“讽刺‌‌‌‌‌‌”。毕竟,‌‌‌‌‌‌“幽默‌‌‌‌‌‌”需要深刻理解语境以及每个词语涵盖的各种文化意义。

除了这些异想天开的推测之外,麦考伊怀疑这个实验还可以作为理解人们对其他群体私下看法的有效工具。例如,你会选择哪个词来证明你是一个女人?又或者会选择哪个词来证明你是法国人还是社会主义者?无论哪种情况,你选择的词应该是只有特定群体成员内部才了解的特质,而这种特质是群体以外的人不了解甚至可能忽略的。

与此同时,麦考伊发现这一最简单的‌‌‌‌‌‌“图灵测试‌‌‌‌‌‌”有助于挑起关于人工智能本质的争论。麦考伊说:‌‌‌‌‌‌“向知名心理学家提出这个问题,看着他们非常认真努力地思考,经过长达几小时的思考后又激动地改变他们的答案,这非常好玩。但其实这个非常简单的问题只是让你深入思考人与计算机的区别,以及人与计算机如何沟通。‌‌‌‌‌‌”

麦考伊最喜欢的一个词看起来很简单。他说:‌‌‌‌‌‌“我喜欢的一个词是‌‌‌‌‌‌‘嗯……’——这很机智‌‌‌‌‌‌”。

但总的来说,值得记住的一点是,在这个越来越智能化的世界里,如果你确实需要证明自己是一个人,那就尽可能粗鲁一点、有趣一点。