Construction, IT, Science, Economy etc

AI 대모 '페이페이 리', 컴퓨터의 미래를 밝히다 AI Godmother Fei-Fei Li Has a Vision for Computer Vision


  스탠포드 대학의 페이페이 리 교수는 이미 AI 역사에서 자신의 자리를 차지했습니다. 그녀는 수년간 ImageNet 데이터 세트와 대회를 만들어 딥 러닝 혁명에서 중요한 역할을 했습니다 . 이 대회는 AI 시스템이 1,000개 범주에 걸쳐 사물과 ​​동물을 인식하도록 도전했습니다. 2012년 AlexNet이라는 신경망이 다른 모든 유형의 모델을 압도적으로 능가하고 ImageNet 대회에서 우승하면서 AI 연구 커뮤니티에 충격을 주었습니다. 그 후로 신경망은 인터넷에서 제공되는 방대한 양의 무료 학습 데이터와 전례 없는 컴퓨팅 성능을 제공하는 GPU를 통해 발전했습니다 .



ImageNet 이후 13년 동안 컴퓨터 비전 연구자들은 객체 인식을 마스터하고 이미지 및 비디오 생성으로 옮겨갔습니다.Li는 스탠포드의 인간 중심 AI(HAI) 연구소를 공동 창립하고 컴퓨터 비전 의 경계를 계속 넓혔습니다 .올해 그녀는 사용자가 탐색할 수 있는 3D 장면을 생성하는 스타트업 World Labs를 시작했습니다 .World Labs는 AI에 "공간 지능", 즉 3D 세계를 생성하고, 추론하고, 상호 작용하는 능력을 제공하는 데 전념합니다.Li는 어제 대규모 AI 컨퍼런스인 NeurIPS 에서 머신 비전에 대한 그녀의 비전에 대해 기조연설을 했고, 발표 전에 IEEE Spectrum과 단독 인터뷰를 가졌습니다.


왜 당신의 발표 제목을 "시각적 지능의 사다리를 오르다"로 지었나요?
페이페이 리: 지능에는 서로 다른 수준의 복잡성과 정교함이 있다는 것은 직관적인 생각입니다. 이 강연에서 저는 지난 수십 년 동안, 특히 지난 10년 이상의 딥 러닝 혁명 동안 우리가 시각 지능으로 하는 일에 대해 배운 것들이 정말 숨 막힐 정도라는 느낌을 전달하고 싶습니다. 우리는 점점 더 기술에 능숙해지고 있습니다. 그리고 저는 또한 Judea Pearl의 "인과성의 사다리"(2020년 저서 The Book of Why )에서 영감을 받았습니다.

이 강연에는 "보는 것에서 하는 것까지"라는 부제가 있습니다. 이것은 사람들이 충분히 인식하지 못하는 것입니다. 보는 것은 동물과 AI 에이전트 모두에게 상호작용과 일을 하는 것과 밀접하게 연관되어 있습니다. 그리고 이것은 언어에서 벗어납니다. 언어는 근본적으로 아이디어를 전달하는 데 사용되는 의사소통 도구입니다. 제 생각에 이것들은 매우 보완적이지만 똑같이 심오한 지능의 양식입니다.

via youtube

어떤 광경에 본능적으로 반응한다는 말인가요?
리: 저는 본능에 대해서만 말하는 것이 아닙니다. 지각의 진화와 동물 지능의 진화를 살펴보면, 그것들은 매우, 매우 깊이 얽혀 있습니다. 우리가 환경으로부터 더 많은 정보를 얻을 수 있을 때마다 진화적 힘은 능력과 지능을 앞으로 밀어냅니다. 환경을 감지하지 못한다면 세상과의 관계는 매우 수동적입니다. 먹히든 먹히든 매우 수동적인 행동입니다. 하지만 지각을 통해 환경으로부터 신호를 받을 수 있게 되면 진화적 압력이 정말로 높아지고, 그것이 지능을 앞으로 밀어냅니다.

그게 우리가 점점 더 깊은 기계 지능을 만들어내는 방식이라고 생각하세요? 기계가 환경을 더 많이 인식하도록 허용함으로써요?
리: "깊다"는 형용사를 사용할지 모르겠습니다. 우리는 더 많은 역량을 만들고 있다고 생각합니다. 더 복잡해지고, 더 유능해지고 있다고 생각합니다. 공간 지능 문제를 해결하는 것이 본격적인 지능을 향한 근본적이고 중요한 단계라는 것은 절대적으로 사실이라고 생각합니다.


저는 World Labs 데모를 봤습니다. 왜 공간 지능을 연구하고 3D 세계를 구축하고 싶으신가요?
리: 저는 공간 지능이 시각 지능이 향하는 방향이라고 생각합니다. 우리가 시각 문제를 해결하고 그것을 실행과 연결하는 데 진지하다면, 매우 간단하고 일목요연하게 설명되는 사실이 있습니다. 세상은 3차원입니다. 우리는 평평한 세상에 살지 않습니다. 로봇이든 기기든 우리의 물리적 행위자는 3차원 세상에 살 것입니다. 가상 세계조차도 점점 더 3차원이 되고 있습니다. 아티스트, 게임 개발자, 디자이너, 건축가, 의사와 이야기를 나누면, 심지어 가상 세계에서 일하더라도, 이 중 많은 부분이 3차원입니다. 잠시 시간을 내어 이 간단하지만 심오한 사실을 인식한다면, 3차원 지능의 문제를 해결하는 것이 근본적이라는 데 의심의 여지가 없습니다.

https://youtu.be/P9KfyJDQ6gE


AI Godmother Fei-Fei Li Has a Vision for Computer Vision
https://spectrum.ieee.org/fei-fei-li-world-labs
kcontents

댓글 없음:

댓글 쓰기