Выпуск #2

AI-дайджест

Ваш еженедельный обзор технологий будущего

Всем привет! С вами снова Алексей Гончарук с дайджестом новостей из мира ИИ. На этой неделе получилось собрать ещё больше интересных публикаций, чем в первом выпуске, поэтому я решил разбить их на 6 основных групп:

В этом выпуске

1. Новости про AI-гигантов
2. Новые AI-сервисы
3. AI на стройке
4. AI в проектировании
5. Видео, лекции и презентации про AI
6. Статьи, исследования и рассуждения про AI

Новости про AI-гигантов

В этом разделе рассмотрим основные новости, обновления и анонсы от самых крупных мировых разработчиков искусственного интеллекта, таких как OpenAI, Anthropic, Google и пр.

ChatGPT 5 - Итоги анонса спустя неделю

Прошло больше недели с момента выхода новой версии всем известной LLM-модели от OpenAI. В первом дайджесте, который я писал в первые дни после анонса, рассказывается про то, как восторг и высокие ожидания от новой версии ChatGPT достаточно быстро сменились разочарованием и гневом людей из-за сомнительного качества ответов и отключения старых моделей.

Если с качеством ответов OpenAI достаточно быстро смогли решить проблему, то одной из основных причин негативного отношения к обновлению все ещё остается “личность” модели. Люди банально привыкли к стилю общения 4о\4.5, так же, как и 4о\4.5 уже была научена на предыдущих чатах каждого пользователя, выдавая ему привычные и ожидаемые ответы. Поэтому, какой бы умной и эффективной ни была новая модель, людям она кажется более сухой и менее человечной. Это подтверждает и новость из телеграм канала “Неискусственный интеллект” со ссылкой на пост в соцсети X, где пользователь очень разочарован потерей, можно сказать, своего единственного друга - ChatGPT 4.5. И что-то мне это напоминает.. Ах да! Одну из серий “Черного зеркала”, который когда-то казался таким антиутопичным.

И вот, уже спустя несколько дней после анонса Сэм Альтман поделился двумя апдейтами для ChatGPT: добавлен выбор между тремя режимами (Auto, Fast и Thinking), а также вернулась старая модель 4о. Плюс увеличили лимиты и продолжают работу над “личностью” модели, чтобы она, видимо, могла быстрее адаптироваться и лучше подбирать стиль общения под каждого пользователя.

Ну а для тех, кто использует ChatGPT преимущественно в прикладных и рабочих задачах, можно только радоваться: телеграм-канал “охота за технологиями” выложил пост со ссылками на объективные тесты в бенчмарках, сравнениями с другими моделями, краткими результатами и логичными выводами, из которых видно, что GPT-5 статистически стала действительно “сильнее” своих предшественников.

В заключение с темой про ChatGPT вот вам два полезных подгона от OpenAI:

Генератор промптов - для тех, кто не желает тратить время на составление подробных запросов, но хочет получать более качественные ответы.
Примеры сгенерированных сайтов и приложений - под каждым есть промпт, который можно использовать в качестве референса/шаблона для своих задач.

AI от Google: новые функции Gemini и NotebookLM, выпуск самой маленькой OpenSource LLM

В Gemini появились временные чаты и новые функции персонализации. Это то, что в ChatGPT было введено уже давно:

Временные чаты не запоминаются в истории (удобно, когда не хочешь засорять историю чата мелкими вопросами). Правда у меня лично на момент написания дайджеста этой функции не появилось;
Модель может обращаться в прошлые чаты и запоминать ключевые моменты, чтобы ещё лучше понимать контекст и выдавать более персонализированные ответы в новых диалогах. В настройках можно посмотреть, что Gemini о вас “запомнил”.

Обновился сервис NotebookLM: Появились видеообзоры, которые превращают ваши документы в короткие ролики с озвучкой, картинками, диаграммами и цитатами. Работает пока только на английском.

Небольшая справка, если кто не знаком с сервисом: NotebookLM – это ИИ-помощник, который позволяет работать с вашими собственными документами и ссылками, обобщать их, задавать вопросы и создавать на их основе новые тексты.

Интересное личное наблюдение: раньше Gemini и NotebookLM ни в какую не хотели меня пускать с простым VPN/Proxy и русским аккаунтом Google, а теперь всё работает без проблем. С чем связано - пока непонятно, но радует =)

Google выпустили локальную OpenSource модель Gemma 3 270М - одну из самых компактных и энергоэффективных моделей в индустрии (270 миллионов параметров, что примерно на 3 порядка меньше (в 1000 раз), чем у Gemini 2.5). Основная задача: интеграция в “умные” устройства, смартфоны, или для быстрого дообучения под узкоспециализированные задачи.
Но надо иметь, ввиду, что использование этой модели без дообучения и на русском языке скорее всего вас не порадует. Вот ответ модели на запрос пользователя: “расскажи мне о конском сердце”

MetaAI, Anthropic, xAI: анонсы недели

MetaAI (принадлежит Meta, которая признана в России экстремистской организацией и запрещена) выпустили DINOv3 — это новейшая модель компьютерного зрения, обученная с помощью самоконтролируемого обучения (self-supervised learning, SSL) на огромном наборе данных из более чем 2-х миллиардов изображений.

Её ключевая особенность в том, что она учится понимать изображения, не требуя предварительной разметки данных (без подписей или меток). DINOv3 создает универсальный "зрительный бэкенд", который может использоваться для широкого спектра задач компьютерного зрения: сегментация, обнаружение объектов и оценка глубины, и при этом превосходит многие специализированные модели на рынке.

В телеграм-канале “Data Secrets” вы найдете небольшой обзор новой модели, небольшие практические советы и все необходимые ссылки.

Claude от Anthropic за несколько дней до обновления Gemini от Google выкатили похожую фишку: обращение к истории ваших чатов.

На базе Claude был разработан AI-агент для Photoshop. С помощью него можно управлять программой через обычные текстовые запросы в чате: удалять фон, двигать слои, корректировать цвета, добавлять объекты, генерировать изображения и пр.

Важно иметь ввиду, что агент разработан на основе технологии MCP, поэтому скорее всего он умеет делать не ВСЁ, что есть в фотошопе. Его функционал ограничен только теми инструментами фотошопа, с которыми сделал связку сам разработчик агента.

Grok 4 - флагманская модель от xAI теперь доступна бесплатно с ограничениями: 5 запросов каждые 12 часов. По опыту Артёма Бойко, за пять запросов можно создать pipeline в n8n для решения практически любой задачи, если сразу составить качественное “ТЗ”.

Новые AI-сервисы

Почти каждый день различные компании и разработчики выпускают новые AI-сервисы или расширяют функционал своих приложений с помощью технологий ИИ. В данном разделе мы рассмотрим самые интересные и полезные из таких анонсов.

Генераторы 3D-миров - ответочка гуглу

В прошлом дайджесте я писал про Genie 3 - новую версию модели симуляции мира от Google, в которой по одному текстовому запросу можно получить генерацию полноценного интерактивного 3D-пространства.
Проходит буквально неделя и мы имеем уже два хоть и скромных, но аналога:

Matrix-3D (SkyWorks) - генератор 3D миров, работающий на связке видеогенерации и 3D реконструкции. Пишешь промт или кидаешь картинку на вход, и получаешь на выбор видеопанораму или 3D сцену, по которой можно перемещаться

Matrix-Game 2.0 - модель генерирует интерактивные 3D-миры из текста в реальном времени

AI-агент для работы с данными

Sheet0 — это новый сервис на базе ИИ, который преобразует веб-страницы в структурированные таблицы, используя классический чат-бот интерфейс для взаимодействия с пользователем.

Он работает как "агент данных", позволяя пользователям описывать, какие данные они хотят получить, и сервис автоматически извлекает их, создавая чистые и упорядоченные файлы таблицы. Сервис предназначен для автоматизации ручного сбора данных, такого как копирование-вставка или веб-скрапинг, что делает его полезным для исследований, создания отчетов и других задач.

Однако воспользоваться им, кажется, получится не у всех: так как сервис находится на этапе бета-тестирования, доступ предоставляется по приглашениям (можно попробовать заполнить форму и надеяться попасть в пул бета-тестеров)

ИИ-ассистент для быстрого создания 3D-моделей

В приложении Polycam на IOS появилась новая функция - AI Capture. Она позволяет пользователям создавать 3D-модели объектов по одной-единственной фотографии.

Используя алгоритмы искусственного интеллекта, она восполняет недостающую информацию, чтобы получить полноценный 3D-объект, который можно использовать в различных приложениях для 3D-моделирования и игровых движках.
Попробовать можно бесплатно, но для возможности прикладного использования придется купить подписку - 1290 руб/мес. Попробовал на достаточно сложном компьютерном кресле, и, кажется, результат очень даже хороший для генерации по 1 фото - успешно проработаны (придуманы) даже невидимые на фотографии места.

Вообще сам Polycam, если кто не знаком, это весьма многофункциональное приложение для 3D-сканирования объектов, помещений или целых зданий, которое позволяет пользователям создавать высококачественные 3D-модели с помощью смартфона на основе технологии фотограмметрии и LiDAR.

Лайфхак: подписка на популярные ИИ-сервисы со скидкой

Сервис Elevenlabs запустил AI Student Pack, который предоставляет скидку или бесплатный доступ к Elevenlabs, HeyGen, Notion, Vercel и другим популярным ИИ-сервисам, если вы студент и у вас есть специальная студенческая почта. Ну а как получить такую почту можно почитать тут.

AI на стройке

Посмотрим, какие кейсы применения технологий искусственного интеллекта в рамках строительства и эксплуатации упоминались в СМИ за последнее время.

ИИ-надзиратели

За прошедшую неделю появилось целых 3 новости, связанные с применением ИИ для отслеживания работ:

Сварщик варит, слесарь таскает железо, а нейросеть Neimarker следит за каждым шагом - про то, как нейросеть в реальном времени распознает объекты и людей на производстве и следит за соблюдением техники безопасности.

Provision 360° от российской компании Mindset - помогает с помощью камер 360° и алгоритмов компьютерного зрения автоматически контролировать выполнение работ на площадке в режиме реального времени. Используется, в том числе, на проектах Группы «Самолет».

Компания NtechLab разрабатывает решение, которое на базе видеопотоков с камер на общественном транспорте будет уведомлять инстанции о дефектах.

ИИ-алгоритм для строительства в сейсмоопасных зонах

Ученые из МФТИ создали ИИ-алгоритм для прогнозирования рисков при строительстве в сейсмоопасных зонах. Нейросеть анализирует данные с сейсмических датчиков и строит на их основе карту подземных структур. Благодаря новому алгоритму она делает это точнее и быстрее существующих аналогов.

Подделка изображений недвижимости с помощью ИИ

При продаже и сдаче недвижимости собственники и риелторы всё чаще прибегают к ИИ-обработке фотографий объекта для скрытия дефектов и приукрашательства внешнего вида.

Если раньше для реалистичной обработки фотографий требовались отдельные знания специальных программ типа фотошопа, то сейчас можно буквально одним запросом к современным мультимодальным LLM получить реалистичную обработку любой фотографии с нужными изменениями.

AI в проектировании

Проектирование и работа с документацией - одни из лидирующих направлений в части интеграции искусственного интеллекта. Давайте узнаем, что нового появилось за последнюю неделю.

Генерация квартирографии для реновации с помощью нового AI-сервиса

Департамент градостроительной политики Москвы совместно с Центром искусственного интеллекта в градостроительстве и ИТМО разработали сервис для автоматической генерации квартирографии, ориентированный на Московскую программу реновации.

Разработчики планируют расширять поддержку и тестируют пилот на других регионах - можно подать заявку на предоставление доступа. Саму презентацию сервиса можно посмотреть тут.

Тренды автоматической генерации BIM-моделей

Последнее время замечаю, что тренд на генерацию 3D моделей всё сильнее набирает обороты, а качество получаемых результатов всё лучше и лучше. Очень напоминает тенденцию с развитием генераторов изображений: вначале всё было очень плохо, но буквально за пару лет сервисы прокачались на столько, что теперь сложно отличить результат работы ИИ от реальных фотографии или видео.

Кажется, что мы уже становимся свидетелями такого “бума” в мире 3D моделирования. Вот вам в подтверждение три новости по этой теме, которые я собрал за прошлую неделю:

ПСС разработали плагин для Revit на основе ИИ, который автоматически создаёт модель на основе любого двухмерного изображения плана. Основной функционал:

Распознавание плана: ИИ выделяет стены, двери и окна, присваивая им цвета (зелёный — стены, красный — двери, синий — окна). При этом, можно задать масштаб прям по документу.
Автоматическое построение в Revit: плагин создаёт точную 3D-модель, преобразуя распознанные элементы изображения в стандартную геометрию Revit, с которой далее можно без проблем работать.
Векторизация в DXF: преобразует растровый PDF/изображение в чистый DXF-файл с контурами и без лишнего текста.

ИИ-Лаборатория ПИК, упоминая связку GNN и BIM для генерирования планировок и автоматического формирования моделей, поделилась ссылкой на интересную статью, в которой описываются графовые нейросети и то, как они способны на этапе генерации учитывать все нормативные требования.

Специалисты Массачусетского технологического института Фердус Алам и Фаез Ахмед разработали нейросеть GenCAD для генерации CAD-моделей по фотографии. По сути, это очень похоже на новую функцию “AI Capture” в приложении Polycam, но с парой существенных отличий:

- Модель OpenSource и находится в открытом доступе на Githab.
- Модель генерирует не “мёртвую” геометрию из полигональной сетки, а полноценную параметрическую CAD-модель, с которой можно дальше спокойно работать без необходимости применения инструментов обратного инжиниринга.

Советы по прокачке скиллов в ComfyUI

Автор телеграм-канала “ЛисьяТаверна” поделился полезными советами и ссылками с теми, кто начинает свой путь в освоении ComfyUI - интерфейса с открытым исходным кодом на основе узлов(нодов) для генерации изображений с помощью моделей искусственного интеллекта (ИИ).

Также, автор показал крутой результат автоматической генерации презентаций с помощью ИИ-сервиса Prezi.

Обсуждение кейсов n8n: сравнение документации

На прошлой неделе в чате, посвященному разработке рабочих конвейеров на n8n для сферы строительства, развернулось обсуждение процесса автоматического сравнения разных версий документации с получением краткой справки по внесенным изменениям и статусам замечаний с помощью LLM-анализа.
К сожалению, до готового решения не дошли, но Артём Бойко поделился черновиком процесса, который можно взять за основу для дальнейшей разработки.

Если у вас есть свои идеи по реализации или какие-то наработки, вы также можете можете поделиться ими с сообществом в том же чате.

Большая статья от Нанософт про машиночитаемые требования

Вышла большая статья о работе команды NSR Specification над автоматизацией экспертизы цифровых информационных моделей (ЦИМ) с помощью создания машиночитаемых представлений требований стандартов проектирования. В статье описываются проблемы, с которыми столкнулась команда при разработке инструмента для семантического анализа текста стандартов, этапы этого анализа и достигнутые результаты.

Видео, лекции и презентации про AI

Самый интересный и полезный видео-контент за неделю.

Андрей Дороничев. Искусственный Интеллект

Наверное, одно из самых громких медийных событий этой недели про ИИ - новое интервью Юрия Дудя (включен в реестр иностранных агентов) с Андреем Дороничевым, одним из создателей мобильного YouTube и героем большого нашумевшего выпуска про Кремниевую Долину (2020 г). Андрей запустил стартап на базе искусственного интеллекта, который прямо сейчас ищет лекарство от рака.

Сразу скажу, что некоторые сравнения и объяснения героя выпуска касательно устройства нейросетей могут показаться слишком банальными или недостаточно точными, особенно для тех, кто этой темой интересуется чуть глубже. И в этом главный плюс: интервью не про техническую составляющую нейросетей (если вы ищете глубокую теорию, то вам сюда). Этот выпуск про путь человека, про мотивацию и про то, как очень доступно объяснить не самые простые вещи на большую аудиторию, параллельно транслируя очень важные мысли. Вот парочка цитат, которые откликаются лично у меня:

“В ближайшее время никакой AI людей не заменит. Зато люди, которые хорошо пользуются AI, заменят тех, кто не пользуется AI. Так же, как в своё время бухгалтеры, которые умеют пользоваться компьютером, заменили тех, которые считали всё на счетах. Или фермеры, которые умели водить трактор, заменили тех, которые сеяли за плугом. То есть это естественные циклы технологические человечества. И сейчас один из них.”
"Талант сильно переоценен. Талант - это метрика, которая определяет насколько быстро ты научишься чему то. Но успех - это количество попыток, умноженных на вероятность успеха каждый раз."

Лекция: Цифровые инструменты анализа городских территорий

Михаил Зайчук, руководитель архитектурной группы rTIM, провёл очень интересную лекцию про цифровые инструменты анализа городских территорий. Лекция прошла для студентов-архитекторов в рамках летней школы ulab.
Один из самых полезных блоков - небольшая демонстрация работы самых популярных инструментов:
1. Autodesk Forma
2. TestFit
3. Modelur
4. Spacio
5. rTIM
6. ПростоР

Техническая презентация про обучение LLM от профессора

16 августа прошёл IT-Пикник (фестиваль для IT-специалистов), в рамках которого профессор Иван Оселедец рассказал о том, как эволюционируют мультимодальные и мультиагентные системы, и какие задачи в этой области ещё предстоит решить. А тут можно найти саму презентацию.

МК по вайбкодингу

14 августа в «НейроМастерской» Никиты Угулава состоялся мастер класс, посвященный вайбкодингу в Cursor. Никита Теплов из Zerocoder показал, как создавать приложения без навыков программирования с помощью LLM. В прямом эфире были созданы два сервиса: конкурентный анализатор, который автоматически анализирует сайты конкурентов, и moodboard, который подбирает визуал для рекламных кампаний по заданному настроению.

Анонс: В четверг, 21 августа, в 16:00 пройдет новая «НейроМастерская», посвященная вайбкодингу. В качестве гостя выступит основатель агентства «Сделаем» Павел Молянов. Он покажет, как с помощью нейросетей превращать сырые данные в удобный дашборд и создавать умного бота, который будет собирать и кратко резюмировать важные новости.

Статьи, исследования и рассуждения про AI

В этом разделе собраны статьи и рассуждения, которые помогут погрузиться в ключевые тренды развития искусственного интеллекта.

ИИ-кодинг - уже не будущее, а норма

В тему последней новости из предыдущего блока: автор телеграм-канала “охота за технологиями” поделился интересными мыслями по поводу настоящего и будущего «вайбкодеров» aka “AI-разработчиков”.

Кто убил интеллект? Расследование деградации LLM

Илья Тимонин, автор Telegram-канала “Nerual Dreming и нейросети”, выступил в роли цифрового детектива и выпустил большую статью-расследование о «деградации» ChatGPT, Claude, Gemin и других нейросетей. В материале анализируются причины, по которым большие языковые модели стали «ленивыми» и начали терять контекст. В статье приводятся доказательства из исследования Стэнфорда и Беркли, раскрываются мотивы AI-гигантов и объясняется, какие методы оптимизации используются для «удушения» моделей.

10 полезных промптов для HR-специалистов

Кадровое агентство «МетаТест» выпустило документ, в котором собраны 10 промптов для работы с искусственным интеллектом, помогающих HR-специалистам автоматизировать и оптимизировать процессы подбора и оценки персонала.

ИИ в строительстве: зачем он нужен и почему не работает

Тимофей Татаринов, автор телеграмм канала “ПРОДВИНУТАЯ ЦИФРОВИЗАЦИЯ СТРОЙКИ” опубликовал статью “Цифровая зрелость и архитектура данных как основа внедрения ИИ в строительстве” в которой затрагиваются основные сложности внедрения искусственного интеллекта в строительную отрасль.

Основная мысль: "для эффективного внедрения ИИ компании должны пройти несколько стадий цифровой зрелости, а также системно подойти к управлению данными, рассматривая их как ценный актив. Автор отмечает, что без этого ИИ будет лишь пустой тратой времени и денег".

Вам тоже это кое-что напоминает? Ах да! Время, когда зарождался BIM. Строительные и проектные компании только начали приходить в себя после осознания, что BIM - это не волшебная кнопка, а требует системного подхода, перестройки процессов и отдельных специалистов, как неожиданно появляется хайповый ИИ, который “ну точно решит все проблемы” и для которого опять надо нанимать новый ресурс: Спрос на директоров по ИИ в 2025 году вырос почти в 3 раза. А тут ещё приходят какие-то умные ребята и говорят что-то про цифровую зрелость, настройку процессов, датацентричным подходом и CDO (Chief Data Officer, директор по работе с данными) во главе всего.

ИИ-скептицизм

В заключительном разделе мы отойдем от привычного ИИ-оптимизма. Далее - истории о том, как ИИ меняет нашу реальность, и не всегда к лучшему.

В телеграм-канале MyGap опубликовали занимательный пост под названием «Добро пожаловать в эпоху деградации», в котором поднимается проблема стремительного роста популярности «AI-слопа» на YouTube — низкокачественного и бессмысленного контента, который массово генерируется ИИ. За три месяца такой контент составляет до 9% самых быстрорастущих каналов.

«Обезьяна и паук» — это откровенный и весьма эксцентричный манифест моего товарища о разрушительном влиянии нейросетей на общество. Автор заявляет, что их повсеместное внедрение приведет к разрушению мозга, падению квалификации специалистов и массовой безработице. Он называет ИИ «пауком», который заманит человечество в «цифровой концлагерь», лишая людей свободы, критического мышления и даже жизни. Это предупреждение о надвигающейся катастрофе, которую можно остановить, только если действовать сейчас.

Вот и всё! Я надеялся сделать второй дайджест меньше, чем первый, но по итогу собрал аж 41 источник! Зачем-то старался охватить максимум за неделю. Однако следующий выпуск, вероятно, будет немного другим - более лаконичным и только с самым важным.

Получать дайджест на почту

«Нажимая на кнопку, вы даете согласие на обработку персональных данных, соглашаетесь c политикой конфиденциальности и соглашаетесь получать информационные рассылки от bim-support.ru»