<aside> 💡
Оригинал записи по ссылке
</aside>
Доктор Фэй-Фэй Ли, сыграла ключевую роль в создании ImageNet — проекта, который дал толчок развитию глубокого обучения и компьютерного зрения. В выступлении она вспоминает, как данные стали основой для прорывов в ИИ, и как в 2012 году сверточные сети неожиданно превзошли все ожидания, открыв путь к генеративным моделям. Сейчас она работает над следующей большой задачей — пространственным интеллектом, то есть способностью ИИ понимать и моделировать 3D-мир. По её словам, это может быть даже сложнее, чем работа с языком, но критически важно для достижения AGI. По её мнению, AGI невозможен без способности систем понимать, реконструировать, генерировать и действовать в трёхмерном мире, а не только в 1D-тексте. Она объясняет, почему 3D-понимание — это следующая большая проблема после языка и генерации, и как её новая компания World Labs собирается строить foundation-модели, обученные на мире, а не на словах.