Методы заверки ресурсной модели. Возможности и ограничения

Методы заверки ресурсной модели. Возможности и ограничения

Ольга Альмендингер,
Региональный менеджер по консалтингу
октябрь, 2018, MINEX Russia 2018, Москва

«Все модели неверны, но некоторые из них полезны»
Джордж Бокс, статистик

 

Скачать презентацию в pdf

«Все модели неверны, но некоторые из них полезны» – это известный в статистике афоризм хорошо описывает процесс заверки ресурсной модели,

Авторство приписывают Джорджу Боксу, крупному британскому статистику, который внёс заметный вклад в такие области как контроль качества, планирование эксперимента, анализ временных рядов и Байесовский вывод. Его называли одним из великих статистических умов 20 века и нет оснований ему не верить. Из этого следует, что мы не можем создать правильную модель, как бы мы не старались. К счастью, мы можем создать полезную модель, и мы строим модели именно для того, чтобы они помогали нам в решении практических задач.

Максимум, который можно ожидать от любой модели – она обеспечит вас полезным описанием, приближенным к реальности

Насколько неправильной должна быть модель, чтобы перестать быть  полезной?

При проверки модели важно помнить, что модель не является реальностью. Модель – это  отражение отдельных свойств объекта или процесса, приближенное к реальности с долей достоверности достаточной для решении практических задач, для которых создавалась данная конкретная модель.

Таким образом, модель не должна быть истинной, важно чтобы она была применимой для заданных целей и именно этот момент мы должны исследовать при заверки ресурсной модели. Нам нужно знать границы применимости и понимать насколько неправильной должна быть модель, чтобы перестать быть полезной.

Области компетенции

Проверка  модели должна проходить по трем ключевым пунктам:

Первый пункт – это исходные данные, которые ложатся в основу модели. Все знают, как важно качество исходных данных, тем не менее, часто встречается ситуация, когда ресурсный геолог берет подготовленную для него базу и, не вдаваясь в детали, начинает с ней работать. Мы не будем рассматривать вопрос проверки качества исходных данных, но призываем помнить – мусор на входе, на выходе останется мусором. В качестве руководства по оценки качества исходных данных можно использовать Таблицу 1 Кодекса JORC. Пункты, перечисленные в Таблице 1, крайне важны для достоверности ресурсной модели и, в идеале, ресурсный геолог должен пройтись по каждому из них до того, как приступит к моделированию.

Вторая область компетенции – это геостатистическое моделирование. Итоговая модель, полученная в результате наших манипуляций, должна отражать распределение исходных данных и согласовываться с геологической интерпретацией месторождения.

Третий пункт – контекст построения модели. Ее цели и задачи. Если мы имеем данные бурения по редкой разведочной сети и строим на этих данных модель, то с высокой долей вероятности такая модель не будет полезной для целей горного планирования. Однако, если эту модель использовать для планирования следующего этапа разведочной сети и оценки потенциала минерализации, то та же самая модель будет считаться полезной.

Три основных принципа

За длительный период использования геостатистических методов был создан набор инструментов для проверки ресурсных моделей путем сравнения с исходными данными. Тем не менее при проверке важно смотреть на картину целиком, а не углубляться в одни детали, игнорируя другие.

Можно выделить три основных принципа общей проверки модели:

  1. Адекватность
  2. Разумная обоснованность
  3. Концептуальное представление.

Адекватность характеризует отражает ли модель статистику исходных данных. Далее мы рассмотрим какие методы используются для этого.

Разумная обоснованность подразумевает, что модель аккуратно отражает геологическую интерпретацию и характер распределения полезного компонента в недрах.

И концептуальное представление определяется тем, были ли приняты надлежащие и достаточные усилия для изучения геологического строения месторождения. На этот момент, зачастую, не обращают внимания в погоне за конечными цифрами.

Статистические методы

Минимальный набор проверок, используемых, чтобы удостовериться, что модель не содержит критических ошибок, допущенных в ходе моделирования состоит из четырех основных шагов.

Первая, самая простая, проверка – это сравнение базовой статистики входных данных и полученной ресурсной модели

 

Сравнение базовой статистики

Ресурсная модель должна в целом отражать основные содержания в выборке данных опробования. Основные содержания данных опробования могут быть сведены к значениям среднего, моде, медиане и, при необходимости, пороговому значению ураганных проб. Из этого набора статистических параметров складывается ожидаемое среднее содержание в блоке. Если средние содержания в модели существенно отличается от основных содержаний, то явно имеется проблема с моделированием.

При сравнении статистике данных опробования с результирующей ресурсной моделью важно принимать во внимание ряд допущений:

  • Сравнение делается по доменам, выделенным по принципу наличия одной статистической популяции.
  • Статистические параметры рассчитаны по декластеризованным данным, которые адекватно представляют те же участки, что и модель.
  • Среднее содержание по модели либо взвешено на объем блока, либо учитывается только по родительским блокам оценки.

 

Сравнение гистограмм

Количество популяций, присутствующее в выборке исходных данных должно быть воспроизведено в итоговой модели. Процесс интерполяции обладает сглаживающим эффектом, поскольку оценка содержания в каждом блоке модели представляет собой средневзвешенное значение по содержаниям в близлежащих пробах. Следовательно, маловероятно что хвосты распределения  могут быть воспроизведены в гистограмме модели. Приведение формы распределения к колокообразному виду, более близкому к нормальному распределению, также является ожидаемым следствием процесса интерполяции. Этот эффект известен в статистике под названием центральной предельной теоремы. Увеличение количества проб, участвующих в оценке, и размера блока усиливает эффект центральной предельной теоремы.

При сравнении гистограмм содержаний в модели и по данным опробования мы должны увидеть схожесть форм гистограммы с учетом сглаживания и нормализации. При построении гистограммы по модели необходимо удостовериться, что при оценке блоков использовалось достаточное количество проб, находящихся на адекватном расстоянии. Блоки с высокой долей экстраполяции необходимо исключить из исходных данных при сопоставлении, поскольку они будут вносить искажение в общую картину.

Вторым важным допущение при сравнении гистограмм является взвешивание содержаний в блоках на объем, чтобы субблокирование не искажало картину.

Графики SWATH

Графики Swath позволяют сравнивать тренды в исходных данных опробования и оценённых блоках. Идея состоит в том, чтобы удостовериться, что тренды сходны. Для создании графиков рассчитывают среднее значение содержания как по опробованию, так и по модели в пределах коридора приращения. В качестве ширины коридора может быть использована, например, высота уступа карьера, или какое-то фиксированное значение по широте или долготе. Затем по одной оси выноситься среднее содержание, по другой – расстояние (координаты).

Важным допущением этого инструмента является обусловленность тренда одной основной структурой. Наличии нескольких параллельных или косо расположенных относительно друг друга структур может исказить картину и привести к некорректным решениям относительно тренда минерализации.

При соблюдении данного ограничения тренд на выходе должен отражать соответствующий тренд входных данных.

Визуальная проверка

Содержания в блоке должны отражать содержания в скважине в целом и соответствовать границам, визуально определяемым по скважинам.

Визуальная проверка позволяет оценить влияние богатых проб на содержания в блоках модели. В особенности, при проверке необходимо проверять адекватность экстраполяции высоких содержаний, чтобы избежать необоснованного размазывания богатых проб по модели. В дополнение к этому важно удостовериться, что степень сглаживания содержаний в блоках модели адекватно отражает интервал содержаний и модель может использоваться для планирования горных работ с учетом исходных данных и при текущих геологических особенностях.

Такое сравнение обычно делают по планам и разрезам, также полезно выполнять проверку в нестандартных сечениях, чтобы получить полное понимание того, что у вас происходит в модели. При просмотре в привычном ракурсе можно пропустить ошибку. В качестве примера: при проверки модели по стандартному разрезу вкрест простирания содержания в модели адекватно отражали содержания по скважинам, но вид в разрезе по простиранию показала, что богатые содержания были интерполированы по направлению, перпендикулярному ожидаемому. Проверка шагов интерполяции показала, что просто была допущена ошибка при выборе угла вращения в эллипсоиде поиска, где вместо отрицательного значения было использовано положительное.

Статистические методы

Кроме базового минимума можно провести дополнительные проверки, которые могут включать более сложные методики.

Диаграммы рассеяния

Для того, чтобы построить диаграммы рассеяния содержаний в модели против данных опробования, нужно рассчитать средние значения по пробам в блоках и сравнить со средним в этом блоке. При сравнение с помощью диаграмм рассеяния важно удостовериться, что количество проб в блоке достаточное для расчета среднего.  Если проб мало, то сравнение будет некорректным. Если проб недостаточно, можно использовать расчет среднего по объему больше блока и рассчитывать для заданного объема среднее по пробам и по блокам, попадающим  в заданный объем.

Важно учитывать эффект объем-дисперсия. Содержаний в пробах будут иметь более высокую дисперсию, чем содержания в блоках, поскольку они имеют значительно меньший объем. Это различие в дисперсии хорошо проявляется на графике, и именно это, в свое время, подвигло Дэнни Криге к поиску метода оценки, которое мы сейчас знаем как кригинг.

Чем сильнее отклоняется линия регрессии на диаграмме рассеяния от линии 1:1, тем сильнее сглаживание в оценке. При анализе диаграммы мы будем ожидать небольшое отклонение, как на графике, поскольку оценка ожидаемо будет несколько завышать низкие содержания и занижать высокие содержания.

Также для сравнения можно использовать графики квантиль-квантиль (Q-Q plot). Они также не должны точно совпадать с линией один к одному.

 

Анализ чувствительности

Современное программное обеспечение позволяет довольно быстро и просто прогнать процесс интерполяции несколько раз с разными параметрами.  Таким образом можно проверить который из наборов дает лучший вариант по итогам валидации. Такой анализ может, например, оценить влияния разных значений ураганных содержаний на конечный результат.

  • Несколько прогонов с разными значениями одного параметра
  • Оценка влияния параметра на конечный результат
  • Анализ чувствительности дает дополнительную оценку достоверности и степени риска.

Проверка нескольких вариантов приемлемых значений ураганных проб.

 

Блочные модели неопределенности

Блочные модели неопределенности могут быть полезны для определения участков, где модель демонстрирует хорошую эффективность и где низкую. Это могут быть модели дисперсии и эффективности кригинга, а также угла наклона линии регрессии. При интерполяции кригингом эти параметры можно записывать в блочную модель и затем анализировать. Наиболее полезной и сравнимой считается дисперсия кригинга.

 

 

Для определения эффективности кригинга и угла наклона линии регрессии используют ряд статистических параметров, которые являются производными из системы уравнений кригинга:

Дисперсия кригинга (KV) – побочный продукт кригинга, рассчитываемый из вариограмм и весов кригинга, присвоенных в ходе оценки. Показывает относительную меру точности локальной оценки с позиции плотности входных данных.

Множитель Ла Гранжа (µ) – возрастает с экстраполяцией, при разреженной сети данных и/или наличии кластеризации данных. Рассчитывается при определении весов.

Дисперсия блока (BV) – определяет степень разброса (дисперсии) содержаний в блоке. Зависит от размера блока и зон влияния непрерывности. Возрастает при увеличении размера блока из за эффекта объем-дисперсия.

 

Дисперсия кригинга

Дисперсия кригинга – это побочный продукт получаемый в процессе интерполяции методом кригинга, который показывает относительную меру достоверности оценки исходя из геометрии расположения проб в ближайшем окружении в соответствии с моделью вариограмм. Низкие значения дисперсии кригинга подразумевают более аккуратную оценку по сравнению с высокими значениями дисперсии кригинга. Однако, при этом не учитываются реальные содержания в пробах, соответственно дисперсия кригинга является мерой пространственной изменчивости положения, а не мерой фактических различий в содержаниях. То, что дисперсия кригинга учитывает модель вариограмм и взаимное расположение проб, расценивается как положительные свойства, а нечувствительность к дисперсии содержаний считается отрицательной характеристикой.

Дисперсия кригинга для двух блоков, при одинаковом расположении проб друг относительно друга и относительно оцениваемого блока будет одинаковой, несмотря на разный разброс в содержаниях проб.

Потенциально ошибка оценки ожидается более высокой для участков, где пробы ближайшего окружения будут иметь больший разброс содержаний, чем для участков, где пробы ближайшего окружения имеют схожие содержания. Дисперсия кригинга это не учитывает. Некоторые авторы считают это свойство настолько непривлекательным, что рассматривают дисперсию кригинга как бесполезную величину. Другие авторы полагают, что дисперсия кригинга, по всей вероятности, не является  полной мерой, определяющей неоднозначность оценки.

Эффективность кригинга

Наиболее полезной считается мера эффективности кригинга.

Эффективность кригинга измеряет эффективность точного воспроизведения содержания в блоке при интерполяции кригингом. Значение рассчитывается путем сравнения дисперсии кригинга в блоке с теоретической дисперсией блока.

Эффективность кригинга выражается через отношение дисперсии кригинга к межблоковой дисперсии. Этот параметр безразмерный, что позволяет сравнивать его значения из разных доменов.

Если дисперсия кригинга невысокая, относительно межблоковой дисперсии, то эффективность кригинга стремиться к единице. Если дисперсия кригинга высокая и превышает межблоковую дисперсию, что свидетельствует о низкой степени достоверности оценки, то значение эффективности кригинга будет низкой и даже может быть отрицательным.  Низкое значение эффективности кригинга может свидетельствовать о высокой степени сглаживания, соответственно, высокое значение – о низкой степени сглаживания.

Часто эффективность кригинга может выражаться в % с оптимальным значением равным 100%

 

Наклон линии регрессии

 

Угол наклона регрессии определяет степень пересглаженности высоких и низких содержаний. Этот наклон считается эквивалентом наклона линии регрессии оценённых содержаний блоков против реальных неизвестных содержаний.

Чем гуще и равномернее наша сеть опробования, тем ниже значение множителя Лагранжа, поскольку в этом случае нет экстраполяции и кластеризации данных. Множитель Лагранжа будет пренебрежительно мал по сравнению с остальными значениями равенств и угол наклона будет стремиться к единице.  При разреженной, неравномерной сети картина будет обратной.

Наклон слева ≈1, справа 0.5

Ограничения

Для того, чтобы получить корректное сравнение важно учитывать ограничения методов и различия в наборах данных.

 

Геологическое понимание

Дополнительные разведочные работы и актуализация модели по новым данным позволяет повышать степень достоверности модели

Другие методы

Если модель создаётся для намеченного к отработке месторождения, то, как правило, наиболее точной является проверка её достоверности относительно объёма производства фабрики или по всему руднику в целом.

Заключение

Оценка минеральных ресурсов основывается на многих взаимосвязанных и субъективных решениях.
Ключевые моменты проверки:

  • Достаточное качество и объем исходных данных
  • В основе лежит адекватная геолого-структурная интерпретация
  • Модель не искажает входные параметры