麻省理工学院和IBM发表两项研究成果:同时利用AI探索神经科学
7月8日消息,最近,有两项分别来自麻省理工学院和IBM的研究,利用人工智能帮助人们进行神经科学领域的研究,进一步帮助人们加速对人类大脑的理解。一方面,麻省理工学院的研究人员正在训练机器学习模型,研究从单个分割的大脑扫描图像和未标记的扫描图像中,分割大脑解剖结构,从而使用人工智能实现神经科学图像分割的自动化。另一方面,IBM的研究人员创建了一个基于云端的神经科学模型,用于研究神经退行性疾病(由大脑和脊髓的神经元或髓鞘的丧失所致,并随着时间推移而恶化,导致出现功能障碍),并使用模拟生物进化的算法来解决复杂问题。
一、卷积神经网络为卡牌实时提供信息
在前段时间举行的模式识别与计算机视觉大会(Conference on Computer Vision and Pattern Recognition)上,来自麻省理工学院的一组研究人员提出了一种创新的人工智能系统。
该系统可以学习从单个分段脑扫描图像和未标记的扫描图像中,分割解剖脑结构,实现自动化神经科学图像分割。
这种用于神经科学的新型人工智能系统,是基于一款发行于1993年的著名集换式卡牌游戏(Collectible card game)《万智牌(Magic:The Gathering)》而研发。
Amy Zhao是麻省理工学院电气工程与计算机科学系(EECS),以及计算机科学与人工智能实验室(CSAIL)的研究生,同时也是该项研究的第一作者。
最初,她尝试使用一个由卷积神经网络(CNN)技术创建的应用程序,根据智能手机拍摄的照片,实时为《万智牌》中的纸牌提供卡牌的类别、属性和施放费用等详细信息。
这项技术的挑战在于,计算机视觉任务需要一组照片数据集,该数据集不仅包含20,000张游戏卡牌,而且还包含每张卡牌的不同拍摄外观和拍摄属性(如照明)的图片版本。
但是,手动创建这样的一个数据集需要花费大量的实践和精力,因此Amy开始通过合成数据集中所有卡牌的变形版本,来自动创建数据集。
卷积神经网络是一种深度学习算法,具有人工神经网络结构,该算法受生物大脑视觉皮层的启发,用一小部分数据进行训练。
Amy使用200张卡牌,每张卡牌分别搭配10张照片,让卷积神经网络经过训练,学习如何判断卡牌的所处的不同位置和照片外观,如亮度、反射和照片角度,从而能够合成数据集内所有卡牌的真实变形版本组。
二、卷积神经网络分析脑图像的过程
Amy发现,这种变形的方法可以应用于磁共振成像(Magnetic Resonance Imaging,简称MRI)中。磁共振成像是断层成像的一种,能够利用磁共振现象从人体中获得电磁信号,并重建出人体信息。
人工智能深度学习的模式识别功能是机器学习的一个子集,它帮助神经科学家对脑图像进行复杂的分析。然而,训练该机器学习算法是一个昂贵的、劳动密集型的挑战。
一方面,对于神经科学研究,训练机器学习通常需要神经科学家在每一次的脑部扫描中,手动对解剖结构进行数据标记。
另一方面,图像分割是基于共享特征对图像像素进行标记的过程,而磁共振成像的图像又是一个以三维像素形式呈现的体素。
因此,神经科学的研究人员经常需要根据大脑的解剖结构,对体素区域进行分离和标记,手工进行图像分割。
Amy与麻省理工学院博士后助理Guha Balakrishnan、Frédo Durand教授、John V. Guttag教授,以及资深作家Adrian V. Dalca,使用单一标记的分段脑MRI扫描和一组100个未标记的病人扫描,完成了自动化神经科学图像分割过程。
在研究过程中,研究人员使用了两个卷积神经网络。
首先,卷积神经网络从100个未标记的扫描中学习亮度、对比度、噪声和空间变换流场(指运动流体所占的空间区域里的速度、压强等因素)的变化,这些变化模拟了扫描之间的体素运动。
其次,为了合成新的标记扫描,系统生成一个随机的流场,并将这个随机的流场应用于标记的MRI扫描,以匹配未标记扫描数据集中实际患者的MRI。然后,系统将所学习到的亮度、对比度和噪声变化进行随机组合。
最后,系统根据提速运动的流场,将标签标记到合成扫描的图像中。这些合成的扫描图像将被输入到一个单独的卷积神经网络,以便训练该卷积神经网络学习如何分割新的图像。
三、该框架可合成逼真多样的标记实例
此外,研究小组对30种大脑结构的图像分割系统进行了100次扫描,并将其与现有的自动和手动分割方法进行了比较。结果表明,该方法与现有的图像分割方法相比有了显著改进,特别是在海马体等较小的大脑结构方面。
研究人员在论文中表示,在他们的测试集中,分割器在每个例子上都比现有的单次分割方法做得更好,接近完全监督模型的性能(之前大多是半监督的)。该机器学习框架可在多个医学领域应用,比如临床设置,在临床设置中由于时间限制,通常只允许手工注释少量扫描。
对此,麻省理工学院的研究人员表明,通过机器学习从未标记的大脑扫描图像中,独立的空间和外观转换模型,可以合成逼真多样的标记实例。
另外,系统生成的合成示例可以用来训练性能等于甚至优于当前图像分割方法的分割模型,这也是为什么《万智牌》能催生一种可训练人工智能深度学习算法的新方法。
四、什么是进化算法?
最近,IBM的研究人员在《细胞报告(Cell Reports)》和《今日心理学(Psychology Today)》上发布了一种创新方法,通过利用进化算法创建了一个基于云端的神经科学模型,可用于研究神经退行性疾病。
在神经科学和人工智能的交叉领域,是深度学习的另一种方法。深度学习是松散地建立在生物大脑的神经网络层上的,它往往是单一用途的单点解决方案,需要将大量数据集进行广泛训练,并针对特定的环境进行定制。
相比之下,进化算法(Evolutionary Algorithms,简称EA)则简单得多。它是进化计算的一个子集,能够模拟生物进化来解决复杂问题。另外,它基于“适应度”函数中设置的标准来解决问题,几乎不需要数据。
不同类型的进化算法包括遗传算法、进化策略、差分进化和分布估计算法,它们的共同之处在于进化的过程,该过程通常包括随机生成搜索点种群,也称为代理,染色体、候选解或个体。
这些搜索点种群会经历多代的变异操作和选择,而变异操作类似于生物突变和重组过程。
每次种群迭代后,进化算法将计算每个搜索点的适应度,并保留最强(较高的目标值)的搜索点,删除最弱(较低的目标值)的搜索点。
通过这种方式,搜索点的种群经过几代人的进化,将产生解决问题的最佳方案,而适者生存的变异依然存在。
五、基于云端创建神经科学模型
进化算法在本质上是分布式的,这使得它非常适合基于云端或大规模并行的多核处理。在这项针对亨廷顿舞蹈病(Huntington’s disease)的神经科学研究中,研究人员使用了IBM Cloud上的一种最新的非主导排序差异进化(NSDE)算法。
参与这项研究的IBM主发明人、神经科学家James R. Kozloski表示,他们引入了误差函数的软阙值和邻域惩罚,以防止由于目标是精确的特征值而导致的系统偏差。
Kozloski表示,他们使用NSDE框架来修正误差,并根据先前选择的0个误差模型的特征空间和“拥挤度”进行惩罚,从而使算法尽可能均匀地覆盖0个错误区域。这让他们能够创建适合数据的各种参数模型,而不仅仅是单一模型。
该项研究的算法设计大师Tim Rumbell博士和Thomas J. Watson研究中心的计算神经学家表示,这个算法最终将帮助模型进行推广,因为他们支持算法寻找一个参数空间区域,该区域能生成像实验期间所有神经元一样响应的模型。
麻省理工学院的研究人员通过卷积神经网络分析脑图像,以及IBM的研究人员利用进化算法创建了一个基于云端的神经科学模型,这两项研究都是人工智能技术在神经科学领域的发展和应用。未来,当这两项研究进一步成熟和真正落地后,也许将有益于临床医学和神经科学研究的发展,进一步加速人们对人类大脑的科学理解。
|