朱松纯：强认知赢咖4AI的领路人-747绝地悍将-赢咖4注册

ramy 2021-02-01 14:26:06 计算机视觉 | 查看评论

1996 年布朗大学宣传图片。朱松纯与导师 David Mumford 追逐计算机视觉的统一计算框架。

求学期间，朱松纯一直与导师追逐计算机视觉的统一计算框架。

朱松纯率先将概率统计建模与随机计算方法引入计算机视觉研究。在导师建议下，朱松纯基于归约思想将大问题分解成小问题，从具体问题入手，为 David Marr 提出的早期视觉（early vision）概念，包括纹理 (texture)、图像基元（Texton）以及原始简约图（primal sketch）等建立一个统一数理模型，使从纯粹理论、计算角度研究计算机视觉成为可能。747绝地悍将

句子要符合语法结构，视频中的一个事件也有语法结构，寻找这样一个层次化、结构化的解释正是计算视觉的核心问题。2000 年前后，朱松纯提出图像解译（image parsing）与视频解译，把视觉问题全部纳入一个统一框架来求最佳解，扩展了模式识别创始人傅京孙先生的句法模式识别理论，并于 2003 年问鼎计算机视觉领域国际最高奖项——马尔奖。

2002 年，朱松纯加盟美国洛杉矶加州大学（UCLA），任统计系与计算机系教授，计算机视觉、认知、学习与自主赢咖4中心主任。在他之前，仅有 Judea Pearl 在 UCLA 计算机系和统计系兼职教授。

涉足赢咖4领域近 30 年，朱松纯已在国际顶级期刊和会议上发表论文 300 余篇，三次问鼎马尔奖。作为视觉领域行业领军人物，也打破了华人在国际顶尖期刊话语权微弱的局面。

2019 年 6 月，受中美贸易战影响，美国政府对华为进行制裁，华为员工也被 IEEE 禁止参与审稿。不久，大会官方发表声明「力挺」华为。作为这届大会唯一一位华人主席，朱松纯也在这封公开信上署名，联合申明抵制 IEEE 限令，强烈倡导会议主席、编辑们自由选择论文的审裁权利。

科研攻坚：引领技术范式新方向

提前感知未来大方向，正是顶级研究者的厉害之处。

过去几十年间，每一次重大转折都是因为计算机硬件革命，带来新颖的重大工程问题。90 年代末期感知器革命，让朱松纯预见变革即将到来——因为有了数据。

2005 年，朱松纯回到老家湖北鄂州，带头成立莲花山计算机视觉研究院，并筹建了世界最早大数据标注团队。他们雇了几十位平面艺术等专业的年轻人标注图像，座椅、椅背、腿的轮廓要标得很准确，连杯子和盖子都要分开标记。朱松纯认为图像必须标记得非常细致，还制定了 200 多页标记手册。

十几个人一直标数据，做了三年，数据库也只有几十万张图片。而且到了后来，朱松纯也回答不出如何标记。正是在这一过程中，他洞察到机器学习和大数据方法的局限性，「AI 作坊」注定不是通向通用 AI 的道路。

虽然自己是最早一批提倡统计建模与学习的人，但后来朱松纯看到了更大的问题和局势——光解视觉问题是做不好的，还需要大量认知推理。

「没有多少人有勇气去尝试这件事。」 Mumford 曾这样评价朱松纯，「他确实是当今世界上正在扩展计算机视觉概念，以涵盖赢咖4交叉学科重要问题的主要人物。」

2008 年之后，朱松纯转向认知领域的研究，将计算机视觉与认知科学、自然语言理解、赢咖4等学科结合，探索他所称的「赢咖4的暗物质」——占 95％、无法通过感知输入观测到的物质。

比如，你看见了一把椅子，想象身体如何去坐，以及坐下来是否舒服，这里面包括物理、功能、价值观，这些都叫做「暗物质」；一个番茄酱瓶倒放的场景，这里的「暗物质」就是在人们倒放瓶子这个行为中隐含的目的——为了更容易从瓶子里挤出番茄酱。747绝地悍将

感知的图像仅仅提供一些蛛丝马迹；而后面的 95%，包括功能、物理、因果、动机等等要靠人的想象和推理过程来完成。只有把这 95% 搞定了，才能去理解剩下的 5%，否则，就只能穷举所有情况。

朱松纯领导的 UCLA 计算机视觉、认知、学习与自主赢咖4中心（VCLA）也一直致力于计算机视觉、赢咖4技术和赢咖4的 AOG 表征和建模。

AOG（与或图）是一个复杂的概率语法图模型，就像用脑皮层里面学习到的大量的知识来解释你所看到的「蛛丝马迹」，形成一个合理的解。而这种 Top-down 的计算过程在目前深度多层神经网络中是没有的。

在朱松纯看来，他们正在做的是面向 10 年、20 年后的技术——实现自然的（natural）智能。

2/3 首页上一页 1 2 3 下一页尾页

关于本站

加入我们

网站合作

标签（推荐）