AI•22 января 2026 г.•7 мин

ChatGPT в строительстве: от галлюцинаций к RAG-архитектуре

ChatGPT строительствоRAG архитектураAI галлюцинациинормативная база AI

Год с ChatGPT на стройке

Я начал использовать ChatGPT в работе в начале 2025 года. Первое впечатление — восторг. Нейросеть за секунды выдаёт развёрнутые ответы на вопросы, над которыми раньше приходилось сидеть с нормативными документами по полчаса. Какой минимальный защитный слой бетона для фундамента? Какой шаг стропил при нагрузке 250 кг/м²? Какие требования СП к вентиляции подкровельного пространства?

ChatGPT отвечает уверенно, подробно, со ссылками на конкретные пункты нормативных документов. Проблема в одном: значительная часть этих ответов — выдумка.

Анатомия AI-галлюцинаций в строительстве

Термин «галлюцинации» в контексте AI — это когда модель генерирует правдоподобный, но полностью вымышленный ответ. В обычных задачах это может быть несущественно. В строительстве это опасно.

Вот что я обнаружил за год работы:

Несуществующие пункты нормативных документов

ChatGPT уверенно ссылается на конкретные пункты СП и ГОСТ, которых не существует. Например, может сослаться на «п. 8.4.3 СП 70.13330» с конкретными цифрами допусков — а такого пункта в этом СП нет. Или выдать требование из одного документа, приписав его другому.

Самое опасное — эти ссылки выглядят абсолютно достоверно. Формат правильный, номер документа реальный, формулировка профессиональная. Отличить галлюцинацию от настоящей нормы может только человек, который работает с этим документом регулярно.

Устаревшие и смешанные нормы

Строительная нормативная база России — это многослойная система. СНиПы частично заменены СП, некоторые ГОСТы отменены, другие актуализированы. ChatGPT не различает действующие и отменённые документы. Он может смешать требования из СНиП 1980-х годов с актуальным СП, создав гибрид, который никогда не существовал ни в одном реальном документе.

Выдуманные формулы и коэффициенты

Это самая опасная категория. ChatGPT может сгенерировать формулу расчёта, которая выглядит правильно — правильные обозначения, правильная размерность, логичная структура — но использует неверные коэффициенты или неправильно определяет область применения.

Если инженер возьмёт такую формулу для расчёта нагрузки на перекрытие или несущей способности фундамента, результат может отличаться от правильного на 20-40%. Для конструктива это недопустимо.

Почему общие модели не работают для строительных норм

Проблема не в ChatGPT конкретно. Любая большая языковая модель (LLM) работает по принципу предсказания следующего токена на основе обучающих данных. Для строительной нормативной базы это означает три фундаментальных ограничения:

Ограниченность обучающих данных. Строительные нормы — это специализированные документы с ограниченным тиражом. В интернете они представлены фрагментарно, часто в пересказе, иногда с ошибками. Модель обучалась на этих неполных и неточных данных.

Невозможность точного цитирования. LLM не хранит документы — она хранит статистические связи между словами. Поэтому «точная цитата» из СП — это на самом деле реконструкция, которая может совпадать с оригиналом, а может нет.

Отсутствие верификации. Модель не может проверить свой ответ по первоисточнику. Она не знает, правильно ответила или нет. Уверенность в тоне ответа не коррелирует с его точностью.

Решение: 6 месяцев разработки собственного AI

Осознав масштаб проблемы, я решил построить инструмент, который работает иначе. Не генерирует ответы из «памяти» — а находит ответы в реальных документах и формирует ответ на основе найденных фрагментов.

Это называется RAG — Retrieval-Augmented Generation (генерация с дополнением извлечением). Принцип работы:

Пользователь задаёт вопрос — например, «какой минимальный защитный слой бетона для ленточного фундамента?»
Система ищет релевантные фрагменты в базе нормативных документов — находит конкретные пункты СП, таблицы, примечания
LLM формирует ответ на основе найденных фрагментов, а не из своей «памяти»
Ответ содержит ссылки на конкретные пункты реальных документов, которые можно проверить

Ключевое отличие: ответ производится от найденного фрагмента документа, а не выдумывается моделью. Если в базе нет информации — система честно скажет, что не нашла ответ, а не сгенерирует правдоподобную выдумку.

Самая сложная часть: подготовка данных

Разработка архитектуры — это 20% работы. Остальные 80% — подготовка нормативной базы для загрузки в систему.

Строительные нормы — это не просто текст. Это:

Формулы, которые в PDF-документах представлены как изображения. Более 10 000 формул пришлось конвертировать из картинок в текстовый формат вручную и полуавтоматически
Таблицы со сложной структурой: объединённые ячейки, многоуровневые заголовки, примечания под таблицами, которые влияют на интерпретацию данных
Перекрёстные ссылки между документами: один СП ссылается на другой, тот — на ГОСТ, ГОСТ — на ещё один СП. Разорвать эту связь — потерять контекст
Версионность: актуальные редакции, изменения, поправки. Нужно знать, какая версия действует

Каждый документ прошёл семантическую сегментацию — разбивку на смысловые блоки, которые система может найти и предоставить в контексте ответа. Это не простая нарезка по абзацам. Таблица без заголовка бесполезна. Формула без пояснения переменных — набор символов. Пункт нормы без указания области применения — потенциальная ошибка.

RAG vs ChatGPT: принципиальная разница

Разница в подходах — фундаментальная:

Параметр	ChatGPT (общая LLM)	RAG-система
Источник ответа	Статистическая модель	Конкретные документы
Ссылки на нормы	Могут быть выдуманы	Только из реальных документов
Формулы	Реконструкция по памяти	Из первоисточника
Актуальность	Зависит от даты обучения	Зависит от базы документов
Отсутствие данных	Сгенерирует «что-то похожее»	Скажет «не найдено»
Верифицируемость	Низкая	Высокая — есть ссылка на источник

Пример из практики

Вопрос: «Какие требования к анкерному креплению мауэрлата к армопоясу из газобетона?»

ChatGPT выдаст развёрнутый ответ с конкретными цифрами — диаметр шпильки, шаг, глубина заделки. Звучит профессионально. Но часть цифр может быть неточной, а ссылка на пункт СП — несуществующей.

RAG-система найдёт конкретные пункты из СП по каменным конструкциям, СП по деревянным конструкциям и типовые узлы из альбомов технических решений. Ответ будет основан на этих фрагментах с точными ссылками, которые можно проверить за 30 секунд.

Бот для тестирования

Результат 6 месяцев работы — телеграм-бот @buildermind_bot, который можно протестировать прямо сейчас. Задайте ему вопрос по строительным нормам и сравните ответ с тем, что выдаёт ChatGPT. Разница будет видна сразу — по точности ссылок и по честности в случаях, когда информация не найдена.

Бот работает на базе основных нормативных документов для ИЖС. База постоянно расширяется — добавляются новые документы, уточняется сегментация, улучшается качество поиска.

Ограничения и честный взгляд

RAG — не серебряная пуля. У подхода есть ограничения:

Качество зависит от базы. Если документ не загружен в систему — ответа не будет. Это лучше, чем галлюцинация, но ограничивает охват
Сложные вопросы требуют синтеза информации из нескольких документов. Система справляется, но не всегда идеально
Интерпретация норм — это отдельная компетенция. Система может найти пункт нормы, но интерпретировать его применительно к конкретной ситуации должен инженер
Расчёты бот не выполняет — он находит формулы и методики, но подставлять значения и считать должен специалист

Что это значит для отрасли

AI в строительстве — это не будущее, это настоящее. Но использовать его нужно правильно. Общие модели типа ChatGPT хороши для генерации текстов, мозговых штурмов, написания писем. Для работы с нормативной базой, расчётами и проектными решениями нужны специализированные инструменты с верифицируемыми источниками данных.

Мой опыт показал: разрыв между возможностями общих AI-моделей и требованиями строительной отрасли — огромен. Но этот разрыв можно преодолеть. RAG-архитектура — один из путей. Не единственный, но рабочий.

Подробнее о технической стороне проекта я писал на Хабре и VC.ru — если интересна архитектура и детали реализации, найдёте там.

Практический вывод

Если вы используете ChatGPT для строительных задач — всегда проверяйте ответы по первоисточникам. Каждую ссылку на СП, каждый пункт ГОСТ, каждую формулу. Не потому что AI плохой — а потому что он работает иначе, чем мы думаем. Он не знает строительных норм. Он генерирует текст, который похож на строительные нормы.

А для профессиональной работы с нормативной базой — попробуйте @buildermind_bot и оцените разницу.

Telegram VK

← Предыдущая

Как гарантировать качество строительства дома: 5 уровней защиты

Снеговая нагрузка на кровлю: формула расчёта, коэффициенты и таблица плотности снега

Нужна консультация по строительству?

12 лет опыта, 200+ построенных домов. Помогу избежать ошибок.

Оставить заявку