ChatGPT в строительстве: от галлюцинаций к RAG-архитектуре
Год с ChatGPT на стройке
Я начал использовать ChatGPT в работе в начале 2025 года. Первое впечатление — восторг. Нейросеть за секунды выдаёт развёрнутые ответы на вопросы, над которыми раньше приходилось сидеть с нормативными документами по полчаса. Какой минимальный защитный слой бетона для фундамента? Какой шаг стропил при нагрузке 250 кг/м²? Какие требования СП к вентиляции подкровельного пространства?
ChatGPT отвечает уверенно, подробно, со ссылками на конкретные пункты нормативных документов. Проблема в одном: значительная часть этих ответов — выдумка.
Анатомия AI-галлюцинаций в строительстве
Термин «галлюцинации» в контексте AI — это когда модель генерирует правдоподобный, но полностью вымышленный ответ. В обычных задачах это может быть несущественно. В строительстве это опасно.
Вот что я обнаружил за год работы:
Несуществующие пункты нормативных документов
ChatGPT уверенно ссылается на конкретные пункты СП и ГОСТ, которых не существует. Например, может сослаться на «п. 8.4.3 СП 70.13330» с конкретными цифрами допусков — а такого пункта в этом СП нет. Или выдать требование из одного документа, приписав его другому.
Самое опасное — эти ссылки выглядят абсолютно достоверно. Формат правильный, номер документа реальный, формулировка профессиональная. Отличить галлюцинацию от настоящей нормы может только человек, который работает с этим документом регулярно.
Устаревшие и смешанные нормы
Строительная нормативная база России — это многослойная система. СНиПы частично заменены СП, некоторые ГОСТы отменены, другие актуализированы. ChatGPT не различает действующие и отменённые документы. Он может смешать требования из СНиП 1980-х годов с актуальным СП, создав гибрид, который никогда не существовал ни в одном реальном документе.
Выдуманные формулы и коэффициенты
Это самая опасная категория. ChatGPT может сгенерировать формулу расчёта, которая выглядит правильно — правильные обозначения, правильная размерность, логичная структура — но использует неверные коэффициенты или неправильно определяет область применения.
Если инженер возьмёт такую формулу для расчёта нагрузки на перекрытие или несущей способности фундамента, результат может отличаться от правильного на 20-40%. Для конструктива это недопустимо.
Почему общие модели не работают для строительных норм
Проблема не в ChatGPT конкретно. Любая большая языковая модель (LLM) работает по принципу предсказания следующего токена на основе обучающих данных. Для строительной нормативной базы это означает три фундаментальных ограничения:
Ограниченность обучающих данных. Строительные нормы — это специализированные документы с ограниченным тиражом. В интернете они представлены фрагментарно, часто в пересказе, иногда с ошибками. Модель обучалась на этих неполных и неточных данных.
Невозможность точного цитирования. LLM не хранит документы — она хранит статистические связи между словами. Поэтому «точная цитата» из СП — это на самом деле реконструкция, которая может совпадать с оригиналом, а может нет.
Отсутствие верификации. Модель не может проверить свой ответ по первоисточнику. Она не знает, правильно ответила или нет. Уверенность в тоне ответа не коррелирует с его точностью.
Решение: 6 месяцев разработки собственного AI
Осознав масштаб проблемы, я решил построить инструмент, который работает иначе. Не генерирует ответы из «памяти» — а находит ответы в реальных документах и формирует ответ на основе найденных фрагментов.
Это называется RAG — Retrieval-Augmented Generation (генерация с дополнением извлечением). Принцип работы:
- Пользователь задаёт вопрос — например, «какой минимальный защитный слой бетона для ленточного фундамента?»
- Система ищет релевантные фрагменты в базе нормативных документов — находит конкретные пункты СП, таблицы, примечания
- LLM формирует ответ на основе найденных фрагментов, а не из своей «памяти»
- Ответ содержит ссылки на конкретные пункты реальных документов, которые можно проверить
Ключевое отличие: ответ производится от найденного фрагмента документа, а не выдумывается моделью. Если в базе нет информации — система честно скажет, что не нашла ответ, а не сгенерирует правдоподобную выдумку.
Самая сложная часть: подготовка данных
Разработка архитектуры — это 20% работы. Остальные 80% — подготовка нормативной базы для загрузки в систему.
Строительные нормы — это не просто текст. Это:
- Формулы, которые в PDF-документах представлены как изображения. Более 10 000 формул пришлось конвертировать из картинок в текстовый формат вручную и полуавтоматически
- Таблицы со сложной структурой: объединённые ячейки, многоуровневые заголовки, примечания под таблицами, которые влияют на интерпретацию данных
- Перекрёстные ссылки между документами: один СП ссылается на другой, тот — на ГОСТ, ГОСТ — на ещё один СП. Разорвать эту связь — потерять контекст
- Версионность: актуальные редакции, изменения, поправки. Нужно знать, какая версия действует
Каждый документ прошёл семантическую сегментацию — разбивку на смысловые блоки, которые система может найти и предоставить в контексте ответа. Это не простая нарезка по абзацам. Таблица без заголовка бесполезна. Формула без пояснения переменных — набор символов. Пункт нормы без указания области применения — потенциальная ошибка.
RAG vs ChatGPT: принципиальная разница
Разница в подходах — фундаментальная:
| Параметр | ChatGPT (общая LLM) | RAG-система |
|---|---|---|
| Источник ответа | Статистическая модель | Конкретные документы |
| Ссылки на нормы | Могут быть выдуманы | Только из реальных документов |
| Формулы | Реконструкция по памяти | Из первоисточника |
| Актуальность | Зависит от даты обучения | Зависит от базы документов |
| Отсутствие данных | Сгенерирует «что-то похожее» | Скажет «не найдено» |
| Верифицируемость | Низкая | Высокая — есть ссылка на источник |
Пример из практики
Вопрос: «Какие требования к анкерному креплению мауэрлата к армопоясу из газобетона?»
ChatGPT выдаст развёрнутый ответ с конкретными цифрами — диаметр шпильки, шаг, глубина заделки. Звучит профессионально. Но часть цифр может быть неточной, а ссылка на пункт СП — несуществующей.
RAG-система найдёт конкретные пункты из СП по каменным конструкциям, СП по деревянным конструкциям и типовые узлы из альбомов технических решений. Ответ будет основан на этих фрагментах с точными ссылками, которые можно проверить за 30 секунд.
Бот для тестирования
Результат 6 месяцев работы — телеграм-бот @buildermind_bot, который можно протестировать прямо сейчас. Задайте ему вопрос по строительным нормам и сравните ответ с тем, что выдаёт ChatGPT. Разница будет видна сразу — по точности ссылок и по честности в случаях, когда информация не найдена.
Бот работает на базе основных нормативных документов для ИЖС. База постоянно расширяется — добавляются новые документы, уточняется сегментация, улучшается качество поиска.
Ограничения и честный взгляд
RAG — не серебряная пуля. У подхода есть ограничения:
- Качество зависит от базы. Если документ не загружен в систему — ответа не будет. Это лучше, чем галлюцинация, но ограничивает охват
- Сложные вопросы требуют синтеза информации из нескольких документов. Система справляется, но не всегда идеально
- Интерпретация норм — это отдельная компетенция. Система может найти пункт нормы, но интерпретировать его применительно к конкретной ситуации должен инженер
- Расчёты бот не выполняет — он находит формулы и методики, но подставлять значения и считать должен специалист
Что это значит для отрасли
AI в строительстве — это не будущее, это настоящее. Но использовать его нужно правильно. Общие модели типа ChatGPT хороши для генерации текстов, мозговых штурмов, написания писем. Для работы с нормативной базой, расчётами и проектными решениями нужны специализированные инструменты с верифицируемыми источниками данных.
Мой опыт показал: разрыв между возможностями общих AI-моделей и требованиями строительной отрасли — огромен. Но этот разрыв можно преодолеть. RAG-архитектура — один из путей. Не единственный, но рабочий.
Подробнее о технической стороне проекта я писал на Хабре и VC.ru — если интересна архитектура и детали реализации, найдёте там.
Практический вывод
Если вы используете ChatGPT для строительных задач — всегда проверяйте ответы по первоисточникам. Каждую ссылку на СП, каждый пункт ГОСТ, каждую формулу. Не потому что AI плохой — а потому что он работает иначе, чем мы думаем. Он не знает строительных норм. Он генерирует текст, который похож на строительные нормы.
А для профессиональной работы с нормативной базой — попробуйте @buildermind_bot и оцените разницу.
Как гарантировать качество строительства дома: 5 уровней защиты
Следующая →Снеговая нагрузка на кровлю: формула расчёта, коэффициенты и таблица плотности снега
Нужна консультация по строительству?
12 лет опыта, 200+ построенных домов. Помогу избежать ошибок.
Оставить заявку