Что такое активность цемента: Активность цемента

Содержание

Определение марки (активности) цемента

Активность цемента определяется как показатель фактической прочности образцов, специально изготовленных для анализа и испытанных в заданных условиях, определенных нормативными документами.

Существует два параметра, определяющих активность (марку) цемента – это определение прочности на разрыв и на изгиб. Для таких испытаний необходимы специально созданные образцы из цементного теста нормальной консистенции, размерами 40*40*160 мм. Все этапы их изготовления и испытания определяются ГОСТом 310.4-81.

Для определения активности цемента применяют как прямые, так и косвенные методы. Прямые методы, самые действенные, но требуют длительного времени (процесс определения основан на твердении цемента), так что для оперативных задач используют косвенные, более быстрые методы. Здесь подходы могут быть различные: кто-то использует контракцию, кто-то оценивает активность через электропроводность цементной суспензии. Оценка активности через электропроводность – простой путь, который при этом нельзя назвать надежным. Прогнозируемые результаты не имеют методологического обоснования и потому рекомендацию для использования в серьезных случаях получить не могут.

Действие контракциометров основано на установлении связи активности цемента с процессом уменьшения объема цемента в результате гидратации специально изготовленного цементного раствора. Это единственный вид приборов, который может быть признан эффективным для оперативного определения активности цемента.

Существуют приборы контракциометры КД-07 и ВМ-7.7, которые могут дать методологически обоснованный результат, однако в данном случае в процессе определения активности (марки) цементов требуется визуальное наблюдение за технологическим процессом, а также проведение подсчета результатов вручную в соответствие с установленной методикой.

Приготовление цементного раствора нормальной консистенции для определения марки цемента

Определение марки цемента предполагает приготовление цементно-песчаного раствора заданным образом. Для смешивания раствора в пропорции 1:3 понадобится:

  • 500 г цемента (непосредственно того образца, который назначен к исследованию).
  • 1,5 кг песка. Для получения точного результата важно выбрать правильный песок – чистый (мытый) кварцевый песок, с содержанием SiO2 не менее 98%. Влажность материала – менее 0,2 % с потерями при прокаливании менее 0,05%.

Если не соблюсти эти условия, то оценку марки цемента нельзя будет признать корректной.

Оба компонента высыпают в чашу, внутренняя часть которой протерта мокрой тканью. Срок для промешивания – 1 минута. Затем в смеси делается лунка, в которую вливают 200 г воды. Время, выделяемое на впитывание – 0,5 минут, а затем в течение минуты перемешивают вручную. Далее смесь помещают в мешалку (ее чашу протирают влажной тканью) и мешают в течение 2,5 минут.По окончанию процесса нужно оценить консистенцию получившегося раствора. Для этого применяют встряхиватель, на котором имитируют виброуплотнение раствора.

Смесь закладывается в два этапа слоями равной толщины в стандартную форму-конус, установленную на диск встряхивающего столика, а после этого штыкуется по ГОСТу:

  • нижний слой – 15 раз,
  • верхний слой – 15 раз.

Затем, в указанной последовательности, выполняются следующие действия:

  • Форму для загрузки снимают, излишки раствора срезают.
  • Цементный конус встряхивают 30 раз в течение 30 ± 5 секунд.
  • Основание конуса измеряют по перпендикулярным диаметрам и берут среднее значение.

Раствор нормальной консистенции и приемлем для измерений, если его расплыв 106-115 мм.

Изготовление образцов

Образцы для определения марки цемента изготавливают стандартных размеров в специальных формах. Формы должны быть разъемными и из прочного материала – к примеру, из чугуна или стали. Перед заполнением раствором форму смазывают машинным малом, а стыки – вазелином. Форму заполняют на 10 мм, устанавливают на вибростенд и после запуска установки форма заполняется окончательно – порционно в течение 2 минут. Через три минуты установка отключается, а излишки смеси снимают ножом, смоченным в воде. Образец сглаживают, маркируют и, оставляя его в форме, выдерживают в специализированной ванне с гидравлическим затвором 24 часа (в случае растрескивания образца, оставляют его в ванной еще на 48 часов). Затем их достают из ванны, извлекают из форм и укладывают в бассейн с водой. Вода должна быть 20 ± 2 градусов по Цельсию и накрывать образцы минимум на 20 мм. Воду в бассейне заменяют раз в две недели. И после 28 суток твердения их извлекают из ванной, испытания проводятся максимум за час.

Виды определения пределов прочности

В зависимости от особенностей дальнейшего использования цемента и бетона на его основе существует несколько различных подходов к определению активности. Рассмотрим несколько методик.

Определение прочности на изгиб

Суть метода в постепенном увеличении нагрузки на образец посредством специального пресса (скорость нагружения — 50±10Н/с). При этом испытание образцов производится при их расположении поперечной гранью – продольно. Итоговый результат берут как среднее арифметическое между двумя самыми высокими показателями испытаний образцов из трех.

Определение прочности при сжатии

Этот метод требует равномерной нагрузки с предельной силой — 200-500кН. Для этого три образца, разделенных на половины, располагают между специальными полированными металлическими пластинами. Площадь соприкосновения образца в продольном положении и пластины – 25 см2. После центровки на опорной плите в качестве результата принимается среднее значения четырех самых высоких показателей.

Определение прочности цемента при пропаривании

Для изготовления конструкций из бетона или железобетона подчас необходимо сократить срок твердения. Для этого используют тепловлажную пропарку. Именно поэтому для таких случаев целесообразно использовать определение активности цемента при пропаривании.

Подготовка образцов и все процедуры проводятся в стандартных условиях, однако пропаривание необходимо производить в специализированной камере. Стандартизированная температура — 20±3 градусов по Цельсию при выключенном обогреве в течение 2 часов. Значение прочности определяется в соответствие с ГОСТом.

 

Однако все эти методы требуют очень длительного времени. Самый скорый метод определения марки цемента без потери точности измерений – контракциометрический. Он использует для оценки показатели уменьшения объема раствора при гидратации материала. Именно эти данные ложатся в основу расчетов активности цемента. Именноэтот метод лег в основу нового прибора предприятия «Интерприбор».

Этот прибор позволяет исследования по определению активности цемента проводить в ускоренном режиме – то есть фактически в течение 3 часов. Также «Цемент-прогноз» позволяет работать с такими измерениями как сроки схватывания цемента, морозостойкость, прочность и водонепроницаемость бетона.

Новый прибор для определения активности цемента

В 2009 году компания «Интерприбор» разработала и запатентовала прибор «Цемент-Прогноз», основанный на контракциометрическом методе измерений. Этот прибор автоматический. В его стандартную комплектацию входят: электронный блок, стакан для проб цементного образца, камера измерения и сервисное ПО, нацеленное на обработку данных по методике. Именно программное обеспечение позволяет все результаты перенести на компьютер, заархивировать и, при необходимости, конвертировать в Exсel.

Принцип работы прибора основан на регистрации изменения объема воды в герметичной камере, дополнительно можно фиксировать температуру пробы. Камера заполняется водой, а в нее помещается образец в специальном мерном стакане. Измерение занимает в минимальном варианте три часа, по факту которых все измерения переносятся в компьютер. Но существует и 7-суточный контракционный цикл измерений.

Электронный блок позволяет через соединительную коробку подключать и одновременно производить измерения в трех камерах, регистрируя результаты на дисплее прибора и компьютере. Сервисное ПО предлагает обширный объем функций по обработке результатов. Прибор внесен в Государственный реестр средств измерений.

Использование «Цемент-Прогноза» в рабочем процессе облегчит и другие технологические измерения, в частности оценку водоцементного отношения и прочность бетона (МИ 2488-98), морозостойкость (МИ 2489-98), водонепроницаемость бетона (МИ 2625-2000).

 

Активность цемента и марка (таблица)

Активность цемента – показатель, являющийся ключевым для определения характеристик прочности готового монолита на изгиб и сжатие. Данный параметр напрямую зависит от таких факторов, как тонкость помола клинкера, условия и сроки хранения готовой смеси, а также состава материала.

Определить активность можно несколькими методами – в условиях завода и лаборатории выполняют ряд исследований в порядке, установленном ГОСТом. Сложно, но возможно это сделать и в домашних условиях. Также может использоваться специальный прибор.

В зависимости от активности цементу присваивается определенный класс и марка (любая таблица с характеристиками обязательно включает эти данные).

Прежде, чем использовать цемент в работе и реализовывать те или иные задачи, необходимо ознакомиться с сутью понятия и особенностями установки параметра активности.

Содержание

  • 1 Что это такое
  • 2 Факторы, влияющие на прочность цемента
    • 2. 1 Условия хранения
    • 2.2 Состав материала
    • 2.3 Дисперсность частиц
  • 3 Как определяется активность
    • 3.1 В домашних условиях
    • 3.2 Новый прибор для определения

Что это такое

Точное определение активности цемента демонстрирует абсолютную прочность испытуемого образца, сделанного из цементного раствора. На основании полученных показателей вяжущему присваивают ту или иную марку и больше понятие активности не используют (в технической документации оно не указывается). Но есть определенные случаи, когда активность и марка цемента устанавливаются в домашних условиях.

Уровень прочности может меняться в зависимости от того, какой вид присадок вводится в состав и в каких объемах. При этом, следует учитывать, что присадки влияют на характеристики смеси и активность, но никак не на марку цемента. К примеру, ускоритель твердения может в разной степени понижать срок набора прочности монолитом, но вот на твердость камня не влияет.

Таким образом, получается, что активность цемента – это своеобразное поведение структуры материала на протяжении срока службы залитой конструкции или изделия.

Как проходит процесс гидратации на разных этапах:

  • На протяжении первых 28 суток после приготовления раствора – монолит набирает прочность по проекту, в это время основной объем структуры вступает в реакцию и кристаллизуется.
  • На протяжении времени эксплуатации – кристаллизация еще может проходить, но активность в состоянии покоя может отсутствовать.
  • Окончание срока эксплуатации – минералы в составе кристаллов начинают реагировать с водой, что ведет к коррозии, деформации и другим изменениям.

Получается, что активностью называют динамику твердения и набора прочности застывшего камня, а потом и потери прочности.

Виды активности цемента на протяжении времени эксплуатации:

  • Активная – все компоненты в составе начинают реагировать, через 28 суток перестают кристаллизироваться.
  • Перспективная – цемент набирает прочность, достигает 100% состояния по проекту (в течение года при монтаже конструкций до ввода объекта в эксплуатацию).
  • Частично гидратированная (комплексная) – крупные негидратированные части остаются в составе монолита и выступают наполнителем.

Такая условная классификация дает возможность правильно определять состав цемента для приготовления разного типа бетонных смесей и выбора оптимального раствора в процессе проектирования.

Факторы, влияющие на прочность цемента

На прочность цемента влияют несколько основных факторов и несколько второстепенных. Но все они должны обязательно учитываться.

Условия хранения

Время и условия хранения цементного порошка влияют на активность и число МПа прочности. Чем дольше хранится цемент, тем менее он прочный в растворе и тем ниже активность. К примеру, за 3 месяца марка М500 обладает показателями марки М400, а по завершении установленного срока хранения порошок теряет 25-30% изначальных параметров.

Снижение активности в процессе хранения цемента:

  • В закрытом сухом складе и водонепроницаемых мешках порошок хранит свойства на протяжении месяца, через 2% параметр снижается на 5%, через 3 – на 9%, 4 – на 13-16%.
  • В бумажных мешках и сухом складе – через месяц отмечается понижение на 5-6%, через 2 – на 10-11%, 3 – 14-15%, 4 – 20-22%.

Состав материала

Многое зависит и от состава клинкера, качества его обработки в процессе производства вяжущего: в него входят основное сырье, минералы. Активность напрямую зависит от объема и вида вводимых в состав добавок, наличия/отсутствия примесей, концентрации клинкера и т.д.

Так, если в составе есть кварц и кальцит, активность понижается, если же больше алита и алюминатов – всегда повышается. В свою очередь, щелочные добавки влияют на скорость прохождения процесса кристаллизации (в сторону ускорения или замедления).

Дисперсность частиц

Здесь речь идет о степени помола всех компонентов. Порошок мелкодисперсный намного быстрее активизирует реакцию по объему, повышая активность. Если помол крупный, набор прочности происходит намного дольше и активность понижается.

Есть определенная взаимосвязь активности и плотности (удельного веса) цемента. Чем выше показатель активности, тем выше плотность.

Ввиду влияния на свойства цемента множества факторов, очень важно осуществлять контрольные испытания с целью определения характеристик. После исследований принимают решение про корректирование состава либо добавку определенных замедлителей/катализаторов.

Как определяется активность

Чтобы определить активность, используются лабораторные тесты, порядок проведения которых указан в ГОСТе 310.4.

Как определяют активность цемента:

  • Приготовление цементного раствора из вяжущего, многофракционного песка в соотношении 1:3 и водоцементным отношением до 0.5. Сухая смесь перемешивается с водой.
  • Испытания конусом и специальным встряхивающим столиком. Цемент должен демонстрировать расплыв от 106 до 115 миллиметров. Если нужно, все операции повторяют с другим объемом воды.
  • Из цемента нормальной густоты делают балочки величиной 4х4х16 сантиметров: смесь укладывается в смазанные маслом формы, послойно и с использованием виброплощадки.
  • В первые сутки цемент твердеет в ванне с гидравлическим раствором, потом 28 суток в холодной воде. Вода меняется через 14 суток.
  • Три полученных результата (конус, балки, твердение в воде) суммируются и определяется самая близкая по индексу марка вяжущего.

Если сроки исследований не определены или использовался несвежий цемент, активность может быть определена неправильно.

В домашних условиях

Приобретая вяжущее, его проверяют на качество и прочность. Сделать это вне лаборатории и без специальных средств трудно, но можно. Обычно оценивают состояние и цвет. Порошок с высокой активностью должен быть серого цвета с зеленым подтоном. Он хорошо протекает сквозь пальцы, комки могут быть только в мешке и минимального размера (и разминаются легко в руках). Если есть твердые комки – свойства ухудшаются.

Тестирование водно-визуальным методом:

  • Смешивание цемента с щелочной минеральной водой до получения консистенции теста.
  • Формирование образца в форме диска с тонкими краями и утолщением внутри. Если тестовый образец затвердел за 10-12 минут и ощутимо нагрелся – цемент качественный, активность высокая. Материал низкого качества твердеет в течение получаса, потом может покрываться трещинами.
  • Затвердевший диск аккуратно оборачивают влажной тканью, отправляют в полиэтиленовый пакет или емкость из пластика. Выжидают 3 суток, достают и смотрят: материал должен стать еще более прочным, при постукивании давать металлический отзвук, от удара не рассыпаться. Возможно наличие минимальных трещин в формате сетки.

Осуществляя тестирование, нужно проверять цемент разных партий – материал везде разный.

Новый прибор для определения

Для определения активности цемента могут использоваться специальные приборы. Так, компания «Интерприбор» в 2009 году запатентовала устройство «Цемент-Прогноз», которое осуществляет контракциометрический способ исследований. Прибор работает автоматически, комплектация включает: сервисное ПО (благодаря ему можно переносить результаты исследований на компьютер, отправлять в архив, Excel), камера изменения, стакан для проб образца, электронный блок.

Прибор определяет температуру и изменения объема воды в камере. Камеру заполняют водой, отправляют образец в стакане, ждут три часа и получают результаты. Есть и цикл контракционных измерений, проходящий за 7 суток.

Благодаря соединительной коробке электронный блок можно подключать к 3 камерам, проводя в них исследования одновременно. Функций для обработки результата огромное множество. В Государственный реестр измерений прибор внесен.

«Цемент-Прогноз» позволяет не только облегчить проведение исследований, но и выполнять их в разных форматах: есть приборы для измерения водонепроницаемости бетонного монолита, прочности и водоцементного отношения, морозостойкости и т. д.

Планируя выполнять ремонтно-строительные работы, очень важно проверять качество и свойства используемого цемента, так как от него зависят долговечность и надежность конструкций/сооружений. До начала работ нужно точно определить, что вяжущее соответствует марке и указанным характеристикам.

Урок 1 — Использование бетона

Урок 1 для печати: Использование бетона

Возраст: 7-12 классы
Предметы: Материаловедение, Науки о Земле
Навыки: Классификация, идентификация,
обсуждение, перечисление, применение, наблюдение Объем
Продолжительность: 60 90 45 минут Любой
Настройка: Класс
Ключевой словарь: Цемент, бетон

Цели

Учащиеся узнают 1) Разница между цементом и бетоном. 2) Как используются цемент и бетон. 3) Как производится цемент.

Метод

Учащиеся посмотрят видео о цементе и бетоне, а затем составят список мест, где используется бетон.

Предыстория

Цемент и бетон могут быть синонимами бытовых терминов, но по своей природе они разные. Цемент, сверхтонкий порошок серого цвета, связывает песок и камни в массу или матрицу бетона. Цемент является основным компонентом бетона.

Помимо семантики, бетон является характерным материалом для подъездных путей, патио, подвалов и множества других предметов домашнего обихода. Он также является наиболее широко используемым строительным материалом в мире. Ежегодное мировое производство бетона составляет около 5 миллиардов кубических метров. Годовой объем производства цемента составляет около 1,25 миллиарда тонн.

Популярность бетона во всем мире не случайна — некоторые из самых распространенных в мире ресурсов производят универсальный, похожий на камень материал.

Портландцемент — это общий термин почти для всех современных цементов. Своим названием и происхождением он обязан британскому каменщику Джозефу Аспдину. В 1820-х годах поиски Аспдина промышленного аналога природного или римского цемента (полученного из вулканического пепла и других природных минералов) привели к его открытию и патенту на портландцемент.

Название Аспдина для его изобретения служило двум целям. Это отличало материал от римского цемента, существовавшего веками. Это тоже был маркетинговый ход. Бетон, сделанный из его нового цемента, напоминал высоко ценимый строительный камень, добываемый на острове Портленд.

Современный портландцемент является продуктом высокотемпературной конверсии тонкоизмельченных материалов, часто таких же основных, как смеси известняка, глины и сланца, содержащих четыре основных ингредиента: оксид кальция, кремнезем, глинозем и железо. Производители полагаются на отечественные материалы. Цементные заводы расположены рядом с карьерами, в породах которых содержатся некоторые или все эти элементы.

При обработке в длинной горизонтальной печи, известной как вращающаяся печь, смеси сырьевых материалов переформулируются в стеклообразные конкреции, называемые клинкером. Затем поставщики измельчают клинкер и гипс до предельной тонкости для производства цемента. Готовый продукт отгружается производителям бетона в мешках или навалом.

Естественный химический состав цемента оживает в присутствии воды, песка и гравия или щебня, известного как мелкий и крупный заполнитель. При смешивании с водой соединения кальция в цементе гидратируются с образованием новых агентов, которые связывают заполнители в бетон.

Как и цемент, бетон производится из местных ресурсов, при этом многие сорта мелкого и крупного заполнителя доступны от региона к региону для удовлетворения потребностей в стандартных и специальных смесях. Бетонные изделия бывают разных форм и применений, каждое из которых при правильном составлении, обращении и размещении может служить десятилетиями.

Материалы

Видео Portland Cement Association, A New Stone Age, доступно по адресу www.youtube.com . Карандаши и бумага.

Процедура

Представьте проект работы с бетоном, описав действия, которые будут выполнять учащиеся, и какие понятия вы хотите, чтобы они освоили. Покажите классу видеоролик Portland Cement Association A New Stone Age, , доступный на youtube.com. Вызовите дополнительный интерес, спросив: «Где вы видели использование бетона?» Словесный список применений должен быть довольно длинным и включать в себя использование бетона, которое находится под землей, и другие виды использования, которые трудно увидеть. Этот список подчеркивает важность бетона в нашей жизни. Покажите этот список в классе, чтобы учащиеся могли дополнить его.

После составления списка всем классом попросите учащихся составить собственный письменный список использования бетона. Этот список следует постоянно расширять, так как курс расширяет знания студентов о применении бетона в качестве строительного материала.

Как предсказывать деятельность завода: начиная с цементных заводов

Способность предсказывать деятельность завода может оказаться очень полезной, чтобы предвидеть сбои или открывать новые возможности для бизнеса. Но как именно это возможно, если доступ к данным о деловой активности ограничен? И как вы можете конкретно сделать это с помощью Dataiku?

Эта статья призвана показать, как можно прогнозировать деятельность фабрик, используя альтернативные данные. Мы пройдем процесс шаг за шагом. Kayrros, компания, которая специализируется на этом типе данных и партнер Dataiku, помогла нам получить необходимые ресурсы для изучения этой темы, взяв интересный пример цементных заводов, отрасли, состоящей из многих взаимозависимостей.

Дилеммы производства цемента

Состоящий в основном из примерно 80% известняка и 20% глины (и небольшого количества гипса), цемент является основным материалом для очень широкого спектра строительных материалов. Бетон, второй наиболее используемый ресурс в мире после воды, не может быть получен без связующего: цемента. Поскольку почти все строительные проекты зависят от его наличия, производство цемента имеет множество последствий, как экономических, так и политических.

После того, как ингредиенты измельчаются вместе в порошок, они отправляются в печь, где они сплавляются вместе, образуя клинкер, необработанную форму цемента. Этот процесс является чрезвычайно энергоемким, так как температура, которую необходимо достичь, составляет около 1450°C (2640°F). Это представляет собой очень важное потребление электроэнергии, которое обычно имеет большой вес в сети и должно учитываться органами, регулирующими электроснабжение. Чтобы избежать этой зависимости, цементные заводы некоторых стран имеют собственную электростанцию, в большинстве случаев работающую на угле.

Эти особенности производства цемента предполагают тщательный контроль времени, когда завод работает или нет. Важно прогнозировать уровень потребления энергии и стимулировать производство энергии. В дополнение к этому, длинная цепочка поставок производства цемента включает в себя множество подотраслей, многие из которых очень зависят от его деятельности (например, транспорт, бетонные заводы, карьеры и т. д.). К сожалению, не у всех есть доступ к уровням производства, а это означает, что решения могут приниматься только в ответ на производство цемента.

Что, если бы мы могли обойти эту проблему, получить информацию, которую мы ищем, где-то еще, и сделать прогноз? Вот о чем эта статья.

Данные о цементных заводах

Когда возникает хороший вопрос, например «Как мы можем предсказать производительность цементного завода?» ничего невозможно, если мы не начнем с данных. Для этой части мы постучали в дверь одного из наших партнеров: поставщика данных Kayrros. Вместе мы опубликовали исследование восстановления автомобильной промышленности, а также посещаемости торговых центров во время глобального кризиса в области здравоохранения.

К счастью, Kayrros удалось собрать адреса более 100 цементных заводов в Европе. Из-за близости к известняковым карьерам цементные заводы обычно располагаются в отдаленных местах. Обладая опытом работы со спутниковыми изображениями, команды Kayrros использовали одну из особенностей цементных заводов, о которой мы упоминали ранее: процесс варки для получения клинкера. С датчиками, улавливающими тепло, можно получить информацию о деятельности растения. Более подробную информацию о том, как это сделал Кайррос, можно найти здесь.

Ниже приведено изображение, демонстрирующее обнаружение тепловой активности, наложенное на базовую карту высокого разрешения, показывающую месячную остановку завода HeidelbergCement Rezzato-Mazzano в марте 2020 года.

Источник: Kayrros, Mapbox, содержит измененные данные Copernicus Sentinel (2020-2021)

После обработки спутниковых изображений с помощью алгоритмов компьютерного зрения Kayrros делится бизнес-результатами анализа изображений: активность каждого цементного завода в Европе каждую неделю в течение последних трех лет.

Получив данные, мы загрузили их в Dataiku, чтобы начать исследование, которое позволило бы нам прогнозировать деятельность этих цементных заводов.

Проект, шаг за шагом

Растения, представленные в этом проекте.

Ввод: новый плагин

Мы включаем данные Кайрроса с помощью нового плагина, который мы недавно разработали! Этот плагин запрашивает данные из API Kayrros и форматирует их в набор данных Dataiku, легко соединяя обе платформы. Он будет доступен в магазине подключаемых модулей Dataiku вскоре после публикации этой статьи и, как и любой другой подключаемый модуль, будет иметь открытый исходный код и будет свободно загружаться каждым пользователем Dataiku.

Этот интерфейс (показан ниже) позволяет пользователю вводить свои учетные данные с API-платформы Kayrros и выбирать коллекцию и набор данных, которые они хотят отобразить. После этого соединение с источником данных установлено и можно начинать проект!

Настройки нашего разъема.

Затем мы можем перейти к построению потока как такового. Проект работает в три больших этапа, как показано на рисунке ниже с тремя зонами потока.

Поток нашего проекта.

Этот проект направлен на прогнозирование будущей деятельности цементных заводов в три этапа: 

  • Первый шаг состоит в очистке прошлых данных и добавлении нового месяца в качестве будущих данных для оценки.
  • Второй шаг обеспечивает обогащение нашего набора данных, чтобы предоставить больше информации для модели.
  • Последний шаг включает построение модели для прогнозирования того, открыты ли цементные заводы или нет, и применение ее для прогнозирования активности цементных заводов в следующем месяце.

Давайте рассмотрим эти шаги один за другим.

1. Очистка данных

Плагин коннектора Kayrros выводит первый набор данных (первый синий квадрат слева, для не-датаику-экспертов!). Затем мы используем «Подготовить рецепт» для анализа даты, предоставленной Kayrros, чтобы убедиться, что она понятна компьютеру. Мы также удаляем некоторые столбцы, которые больше не нужны, чтобы вывести набор данных, который выглядит следующим образом date, мы извлекаем функцию для активности: 0 для неактивных растений, 1 для активных растений и значение между обоими для растения, которое только частично активно.0003

Набор данных цементных заводов, визуализированный в Dataiku.

После этого мы включаем рецепт Python, который искусственно генерирует новые немаркированные данные за один месяц, которые мы можем использовать для прогнозирования будущей деятельности цементных заводов.

Наконец, в последнем рецепте этого первого шага мы объединяем эти два набора данных, чтобы применить аналогичные обработки как к исходному набору данных, так и к дополнительному месяцу, который будет использоваться для оценки. Этот шаг важен, поскольку мы не хотим дублировать будущие шаги между прошлыми данными и данными, которые мы будем прогнозировать — вместо этого мы применяем одинаковую обработку к этим двум наборам.

Из этого набора данных мы уже можем построить график, отображающий общую активность цементных заводов в Европе. Мы видим, что цементные заводы имеют ежегодную сезонную активность, с подъемами в середине года и спадом в рождественский сезон.

Общая деятельность цементных заводов в Европе в среднем с 2018 года по настоящее время.

Мы также можем использовать функции графика Dataiku, чтобы показать, в каких странах самые низкие или самые высокие показатели открытия цементных заводов:

2. Обогащение данных

В следующей зоне потока есть два дополнительных рецепта подготовки данных. Первый — это рецепт приготовления, который извлекает дополнительные столбцы, например:

.

Особенности, производные от даты:

  • Год, месяц, число, день недели, неделя года
  • Синусы и косинусы месяца для создания циклического поведения
  • До или после начала пандемии COVID-19
  • Будь то выходные или праздничные дни

Особенности, полученные из географии:

  • Геоточка для создания визуализаций
  • Расстояния до основных достопримечательностей

Мы бинируем интересующую переменную: если объект активен более половины времени (значение ≥ 0,5), он считается активным (мы вводим значение = 1), в противном случае он считается неактивным (значение = 0).

Затем рецепт «Окно» позволяет нам вычислить скользящее среднее переменной, чтобы предсказать, был ли завод активен или нет в последние две недели. Это поможет нам понять, неактивны ли растения только в определенный день в виде исключения или существует долгосрочная тенденция к бездействию. Несмотря на то, что это дает нам полезные подсказки о прошлой деятельности, эта функция не будет построена на всех будущих данных. Действительно, через месяц в будущем знать, каковы будут средние открытия цементных заводов за последние 15 дней, — это умение, которым могут обладать только предсказатели. Поэтому мы не будем использовать его в модели, которую рассмотрим в следующем разделе нашего потока.

3. Моделирование данных

На этом третьем шаге мы стремимся найти особенности, влияющие на активность цементного завода, чтобы создать модель, которая будет имитировать это поведение. Во-первых, мы используем «Рецепт разделения», чтобы разложить данные и разделить их на размеченные и неразмеченные данные, чтобы построить алгоритм на размеченных данных и оценить с его помощью будущие даты.

Визуальное моделирование в Dataiku.

Мы использовали алгоритм машинного обучения вместо прогнозного анализа временных рядов, потому что в данных много пустых дат (условия видимости на изображениях были таковы, что иногда было трудно определить, активен завод или нет). Используя анализ временных рядов, нам пришлось бы провести повторную выборку этих данных и создать «поддельные» точки данных для пустых значений, что сильно исказило бы наши данные. Поэтому мы сохранили стандартную практику машинного обучения, где дата является не индексом, а функцией среди прочих.

Разделение между обучающим и тестовым наборами производится по дате. Однако мы обучали наш алгоритм на датах из далекого прошлого и тестировали его на более свежих данных.

Выбор переменных для включения.

После этого мы выбираем, какие переменные включить в наш анализ. Для каждого из них мы можем выбрать обработку их как числовых или категориальных, как изменить масштаб, справиться с пропущенными значениями и т. д. После этого мы выбираем алгоритмы, которые хотим протестировать на наших данных!

Мы выбрали три очень стандартных алгоритма: логистическая (L2-регуляризованная — Ridge) регрессия, случайный лес и XGBoost. Мы сохранили базовые настройки от Dataiku, так как хотели показать, что даже без очень тонкой настройки этих алгоритмов модель будет давать достойный результат.

Выбор алгоритма в Dataiku.

После выбора этих алгоритмов мы обучаем наши модели и изучаем результаты!

Поскольку мы решили использовать ROC AUC для сравнения наших моделей (мы еще не определились с порогом для применения, поэтому нам нужна была независимая от порога метрика), все три наших алгоритма имеют сопоставимые характеристики: 0,753 для XGBoost, 0,767 для случайного лес и 0,807 для логистической регрессии.

Логистическая (гребенчатая) регрессия кажется наиболее эффективным алгоритмом.

Наиболее важными признаками являются особенности местоположения: Сохранение одного и того же поведения на уровне завода кажется более важным, чем анализ даты. Страны также важны (нахождение в Италии является пятой по важности особенностью и негативно влияет на открытость заводов).

Признак «до или после начала пандемии COVID-19» не имеет высокого значения значимости: коэффициент у него небольшой (0,41) и вроде бы не влияет на результат.

Что касается результата производительности, мы сохранили пороговое значение 0,225, которое максимизирует оценку F1 на уровне 79%.

Основные показатели алгоритма и выбор порога.

Несмотря на то, что эти показатели хороши, и мы уверены, что значительная часть наших будущих данных будет правильно классифицирована, они могли бы быть и лучше. Мы часто говорим, что плохой алгоритм с большим количеством данных будет более полезным, чем выдающийся алгоритм с меньшим количеством данных, и здесь, похоже, это так. Несмотря на то, что количество точек данных довольно велико (~ 39K), количество растений также очень важно, и у нас есть данные более чем за три года, после чего набор данных не так плотен, как мог бы быть. Больше данных облегчило бы моделирование для компьютера.

После развертывания моей модели в моем потоке я оцениваю свои немаркированные данные, что завершает проект. Следующим шагом будет перевод этого проекта в производство, чтобы получать свежие данные еженедельно или ежемесячно.

Визуализация результатов

Эта задача по моделированию позволила нам создать дополнительную визуализацию, чтобы понять важнейшее дело, которым мы занимаемся.

Здесь, например, мы отобразили будущую ожидаемую активность по странам и по заводам за май 2021 года (месяц, для которого у нас не было размеченных данных, который был оценен алгоритмом).

Деятельность по стране, прогноз на май 2021 г.

Деятельность цементного завода, прогноз на май 2021 г.

Мы видим, что наш алгоритм предсказывает, что производство цемента будет медленнее в некоторых странах (например, в Италии) и сильнее в Швеции. Было бы интересно понять, какие экономические условия сделали эти заводы менее эффективными! Это может привести к интересным событиям.