ramy  2021-02-01 14:26:06  计算机视觉 |   查看评论   
朱松纯:强认知赢咖4AI的领路人

1996 年布朗大学宣传图片。朱松纯与导师 David Mumford 追逐计算机视觉的统一计算框架。

求学期间,朱松纯一直与导师追逐计算机视觉的统一计算框架。

朱松纯率先将概率统计建模与随机计算方法引入计算机视觉研究。在导师建议下,朱松纯基于归约思想将大问题分解成小问题,从具体问题入手,为 David Marr 提出的早期视觉 (early vision)概念, 包括纹理 (texture)、图像基元 (Texton)以及原始简约图 (primal sketch)等建立一个统一数理模型,使从纯粹理论、计算角度研究计算机视觉成为可能。747绝地悍将

句子要符合语法结构,视频中的一个事件也有语法结构,寻找这样一个层次化、结构化的解释正是计算视觉的核心问题。2000 年前后,朱松纯提出图像解译(image parsing)与视频解译,把视觉问题全部纳入一个统一框架来求最佳解,扩展了模式识别创始人傅京孙先生的句法模式识别理论,并于 2003 年问鼎计算机视觉领域国际最高奖项——马尔奖。

2002 年,朱松纯加盟美国洛杉矶加州大学(UCLA),任统计系与计算机系教授,计算机视觉、认知、学习与自主赢咖4中心主任。在他之前,仅有 Judea Pearl 在 UCLA 计算机系和统计系兼职教授。

涉足赢咖4领域近 30 年,朱松纯已在国际顶级期刊和会议上发表论文 300 余篇,三次问鼎马尔奖。作为视觉领域行业领军人物,也打破了华人在国际顶尖期刊话语权微弱的局面。

2019 年 6 月,受中美贸易战影响,美国政府对华为进行制裁,华为员工也被 IEEE 禁止参与审稿。不久,大会官方发表声明「力挺」华为。作为这届大会唯一一位华人主席,朱松纯也在这封公开信上署名,联合申明抵制 IEEE 限令,强烈倡导会议主席、编辑们自由选择论文的审裁权利。

科研攻坚:引领技术范式新方向

提前感知未来大方向,正是顶级研究者的厉害之处。

过去几十年间,每一次重大转折都是因为计算机硬件革命,带来新颖的重大工程问题。90 年代末期感知器革命,让朱松纯预见变革即将到来——因为有了数据。

2005 年,朱松纯回到老家湖北鄂州,带头成立莲花山计算机视觉研究院,并筹建了世界最早大数据标注团队。他们雇了几十位平面艺术等专业的年轻人标注图像,座椅、椅背、腿的轮廓要标得很准确,连杯子和盖子都要分开标记。朱松纯认为图像必须标记得非常细致,还制定了 200 多页标记手册。

十几个人一直标数据,做了三年,数据库也只有几十万张图片。而且到了后来,朱松纯也回答不出如何标记。正是在这一过程中,他洞察到机器学习和大数据方法的局限性,「AI 作坊」注定不是通向通用 AI 的道路。

虽然自己是最早一批提倡统计建模与学习的人,但后来朱松纯看到了更大的问题和局势——光解视觉问题是做不好的,还需要大量认知推理。

「没有多少人有勇气去尝试这件事。」 Mumford 曾这样评价朱松纯,「他确实是当今世界上正在扩展计算机视觉概念,以涵盖赢咖4交叉学科重要问题的主要人物。」

2008 年之后,朱松纯转向认知领域的研究,将计算机视觉与认知科学、自然语言理解、赢咖4等学科结合,探索他所称的「赢咖4的暗物质」——占 95%、无法通过感知输入观测到的物质。

比如,你看见了一把椅子,想象身体如何去坐,以及坐下来是否舒服,这里面包括物理、功能、价值观,这些都叫做「暗物质」;一个番茄酱瓶倒放的场景,这里的「暗物质」就是在人们倒放瓶子这个行为中隐含的目的——为了更容易从瓶子里挤出番茄酱。747绝地悍将

感知的图像仅仅提供一些蛛丝马迹;而后面的 95%,包括功能、物理、因果、动机等等要靠人的想象和推理过程来完成。只有把这 95% 搞定了,才能去理解剩下的 5%,否则,就只能穷举所有情况。

朱松纯领导的 UCLA 计算机视觉、认知、学习与自主赢咖4中心(VCLA)也一直致力于计算机视觉、赢咖4技术和赢咖4的 AOG 表征和建模。

AOG(与或图)是一个复杂的概率语法图模型,就像用脑皮层里面学习到的大量的知识来解释你所看到的「蛛丝马迹」,形成一个合理的解。而这种 Top-down 的计算过程在目前深度多层神经网络中是没有的。

在朱松纯看来,他们正在做的是面向 10 年、20 年后的技术——实现自然的(natural)智能。

 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自朱松纯:强认知赢咖4AI的领路人-747绝地悍将

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]