CE ESTE GEOSTATISTICA?

geostatistica, statisticile spațiale, Donald E. Myers

Sursă originală: http://www.u.arizona.edu/~donaldm/homepage/whatis.html

Nu trebuie să fii un statistician care să folosească bine geostatistica, dar este posibil să ai nevoie de asistență, sprijin, îndrumare a unui statistician (geo?). Un bun inginer, ecologist, biolog, om de știință, hidrolog, fizician al solului are deja un început bun, deoarece geostatistica este doar o știință bună adusă până în prezent prin recunoașterea faptului că fenomenele naturale sunt supuse unor variații spațiale. Studiul dvs. de geostatistică nu va înlocui alte cunoștințe pe care le aveți; mai degrabă, vă va extinde cunoștințele și le va face mai util. 

(parafrazată dintr-o citată a lui William Edwards Deming)


UN BIT DE ISTORIE 

Aplicarea statisticilor la problemele din geologie și minerit, precum și în domeniul hidrologiei datează de mult timp. Pentru o vreme, geostatistica a însemnat statistici aplicate geologiei sau, mai general, probleme ale științelor pământului. Începând cu mijlocul anilor 60 și în special la mijlocul anilor 70, a devenit mult mai strâns afiliată lucrării lui Georges Matheron și, probabil, acea conexiune este încă una dominantă astăzi. Deoarece o mare parte din munca sa timpurie, precum și cea a studenților săi apăreau în principal în limba franceză, nu era la fel de bine cunoscută în SUA și în alte țări. Mai multe evenimente s-au schimbat cu toate acestea. În 1975, un ASI NATO a avut loc în apropierea Romei, Italia privind Geostatistica avansată în industria minieră. Procesul conținea lucrări care erau în principal în limba engleză. Acest lucru fusese precedat de un set de note (de Matheron) pregătite pentru un program de vară în Fontainebleau. Aceste note erau în limba engleză, dar nu erau disponibile imediat. Un articol teoretic mai definitiv a apărut în J. Probable Applied în 1973. 

Profesor Matheron se afla la Ecole Normale Superieur de Mines de Paris, unul dintre Grande Ecoles . Ca parte dintr-o mișcare generală a unităților de cercetare din principala locație din Paris (adiacentă la Jardin du Luxembourg), Matheron a înființat Centrul de Morfologie Mathematique. Mai târziu, aceasta a devenit două programe, una privind morfologia matematică și pe geostatistică. Matheron sa retras în funcția de director al Centrului numai anul trecut. Cea de-a doua serie de volum a lui Jean Serra despre morfologia matematică și analiza imaginii este binecunoscută și se bazează pe cartea anterioară a lui Matheron despre teoria seturilor aleatoare. Doi dintre studenții lui Matheron au contribuit la implantarea geostatisticului în America de Nord. Andre Journel sa mutat la Universitatea Stanford în 1978 și a fost co-autor al Geostatisticului Miniercu Ch. Huijbrechts. Michel David sa mutat mai devreme la Ecole Polytechnique din Montreal, iar în 1977 a publicat Estimarea rezervelor de minereuri geostatistice . Journel a fost în cadrul Departamentului de Științe Aplicate ale Pământului, dar mai recent acesta a fost închis și acum este în Departamentul de Inginerie Petrolier și a înființat (cu ajutorul diferitelor companii petroliere) Centrul Stanford pentru Prognoză Reservoară. 

Activitatea lui Matheron nu a fost foarte bine acceptată în comunitatea statistică pentru o perioadă de timp, deși un număr de statisticieni proeminenți au fost vizitatori la Fountainebleau în anii ’70, ’80 și ’90. Aceasta a fost parțial din cauza unui sentiment că o parte din lucrare a fost o dublare a rezultatelor deja cunoscute, dar cu nume diferite. Înclinația lui Matheron de a publica numai în limba franceză și numai în “notele interne” de la Centru a contribuit probabil la această percepție. Cu toate acestea, geostatistica și-a stabilit un loc atât în ​​revistele de statistică, cât și la nivel național. La mijlocul anilor ’80, cu ajutorul lui M. Armstrong, un index al acestor note a fost publicat în Geologie matematică, în timp ce era posibil să se ceară copiile zeroxate din Centru, nu existau un depozit general accesibil în afara Centrului. Indicele menționat mai sus este acum depășit. Din nou, cu ajutorul lui M. Armstrong, un număr mic de aceste note au apărut ca articole de jurnal. GLOSAR 

Software-ul

La sfârșitul anilor ’70, Centrul de Geostatistică, Fountainebleau, a început un program de masterat în geostatistică (doi ani), care a atras un flux continuu de studenți din industrie și guvern în diferite țări. În colaborare cu Shell Oil și Bureau de Recherche Geologie Mathematique (USGS francez), a fost dezvoltat un pachet software comercial denumit BLUEPACK. Versiunea timpurie a fost doar portată la VAX, dar succesorul, ISATIS, este disponibil pe mai multe platforme de stații de lucru. Este comercializat în Statele Unite de GEOMATH din Houston. Geostatistica fără calculator este de interes mic, în multe privințe evoluțiile în geostatistică paralele cu cele din calcul, în special aspectul PC-urilor și al stațiilor de lucru. 

Publicații și conferințe

Două volume mici despre geostatistică, axate pe minerit, au apărut în limba engleză în anii ’70, unul de Jean-Michel Rendu și unul de Isabel Clark. La sfârșitul anilor ’80 a apărut volumul lui Isaaks și Srivastava, ulterior o carte a lui Noel Cressie (pe tema mai generală a statisticilor spațiale, dar care include și geostatistică). 

În vara anului 1983, la Lake Tahoe, NV, cu un mix mai internațional și cu cercetători dintr-un set mai larg de aplicații, a avut loc un al doilea ASI NATO. Datorită unei serii de patru lucrări realizate de Richard Webster și de unii dintre studenții săi (apoi la Centrul de Cercetare Rothamstead din Anglia), geostatistica a devenit cunoscută în științele solului. Acestea au apărut în J. Soil Science (1980-1981). În 1979, la Praga, a fost înființată Asociația Internațională a Geologilor Matematici, iar mai târziu a început publicarea revistei J. of the Int. Assn. Math. Geologi (mai târziu, numele a fost schimbat oficial în Geologie matematică). În timp ce revista nu se limita la geostatistică, a devenit rapid un loc principal pentru publicarea unor astfel de lucrări. Un al treilea congres internațional de geostatistică a avut loc la Avignon, Franța în 1988, al patrulea la Troia, Portugalia în 1992 și cel mai recent la Wollongong, Australia în 1996. În urma conferinței din 1983, Andre Journel și Leon Borgman (Universitatea din Wyoming) retragerea anuală de vară în geostatistică, destinată cercetătorilor din America de Nord. Primul a fost ținut lângă DuBois, Wyoming în august 1984. Grupul a fost mic și familiile au fost încurajate, sesiunile au fost informale și nu s-au produs nicio procedură, dar ulterior a fost lansat un buletin informativ care a apărut rar de atunci. O organizație non-organizată a fost înființată în 1987 la o întâlnire la Chirachaua Mtns, la sud-est de Tucson, nu trebuia să existe taxe, nu există o listă de membri, niciun preț de abonament pentru buletinul informativ, dar voluntarii ar fi solicitați în fiecare an să organizeze întâlniri. Mai multe au avut loc atât în ​​Canada, cât și în SUA, iar în 1996 a avut loc o întâlnire la Guanajuato, MX. În urma instituirii buletinului informativ în America de Nord, a fost creat un alt buletin informativ destinat comunității europene. 

În urma întâlnirii din 1983, mai mulți membri ai personalului de la EPA-Las Vegas au devenit interesați de aplicarea geostatisticului pentru monitorizarea și evaluarea mediului. În plus față de sprijinul pentru cercetare pentru o serie de persoane și programe, EPA a comandat un pachet software geostatistic, GEO-EAS, care a fost apoi lansat în domeniul public. GEO-EAS a fost un program DOS dar a inclus un sistem de meniuri care a făcut-o destul de prietenoasă și prețul a fost corect. Din păcate, din diverse motive, EPA nu a continuat să susțină software-ul și nu a fost actualizat de câțiva ani. În 1992, Andre Journel și Clayton Deutsch au publicat GSLIB care include o dischetă. Acesta a fost un set extins de programe geostatistice (cod sursă FORTRAN) și un manual de utilizare. Versiunile actuale ale codului sunt disponibile pe site-ul web la Stanford. Din păcate, programele nu includ nici o formă de interfață grafică și sunt destinate a fi difuzate în mod discontinuu. Ele sunt însă compilabile pe o varietate de platforme. În 1996 a publicat Yvan PannatierVARIOWIN împreună cu o dischetă. VARIOWIN este o versiune MS-Windows a două dintre componentele GEO-EAS. Aceasta permite seturi de date mult mai mari decât în ​​GEO-EAS și, de asemenea, modelarea interactivă a variogramelor. 

Geostatistica de la Universitatea din Arizona

Geostatistica a fost predată la Universitatea din Arizona încă din toamna anului 1982, dar munca de colaborare a avut loc începând cu mult timp mai devreme între YC Kim și Donald Myers, AW Warrick (Soil, Water and Environmental Sciences) și Donald Myers. Cursurile au atras rapid studenții dintr-o varietate de departamente; Inginerie Minieră, Hidrologie, Sol, Apă și Științe ale Mediului. Mai recent au fost atrași studenții de la teledetecție, patologie a plantelor, geografie, laboratoare de arbori cu arbori, resurse naturale regenerabile. Aceasta este o consecință directă a naturii cantitative a cercetării în aceste diferite programe 

Alte dezvoltări

Au existat alte trei evoluții care nu ar trebui trecute cu vederea. B. Matern, care lucrează în Suedia, a dezvoltat în esență o teorie paralelă cu Matheron, dar cu aplicații în principal în domeniul forestier. Opera sa apare în limba suedeză în 1960 și nu a fost tradusă în limba engleză până în 1986 (Springer-Verlag). Y. Ghandin care lucrează în fosta Uniune Sovietică și-a aplicat activitatea în primul rând în domeniul meteorologiei și științelor atmosferice, unde era cunoscută sub numele de Analiza obiectivelor. Această lucrare nu a apărut în limba engleză decât mult mai târziu, când a emigrat la Isreal. În cele din urmă, în 1971, R. Hardy (Universitatea de Stat din Iowa), care lucra la probleme legate de interpolarea datelor de gravitate, a dezvoltat ceea ce a devenit cunoscut sub numele de Radial Basis Functions. Lucrarea sa este mult mai bine cunoscută în literatura de analiză numerică. 

Aplicații

Geostatistica este foarte mult o disciplină aplicată (sau poate că nu este chiar o disciplină), dezvoltarea sa a fost activitatea inginerilor mineri, inginerilor de petrol, a hidrologilor, a oamenilor de știință din domeniul solului, a geologilor și a statisticienilor. Există aplicații în epidemiologie, patologie a plantelor sau entomologie, precum și în silvicultură, științe atmosferice, schimbări globale, geografie. Există unele suprapuneri cu sistemele informatice geografice (GIS) și cu statisticile spațiale în general. Două alte jurnale ar trebui să fie remarcate în special, Resurse de Cercetare a Apelor și Societatea de Științe a Soilor din America . Mai recent, articolele au început să apară în mediul înconjurător , teledetecția mediului , precum și multe altele prea numeroase. 

După cum sa menționat mai sus, hidrologia a fost o aplicație timpurie, trebuind să se observe activitatea la trei locații; Grupul lui L. Gelhar de la MIT (care are legături cu New Mexico Tech din Socorro), grupul de hidrologie de la Fontainebleau (în special G. DeMarsily care este acum la Université Paris-Jussieu) și bineînțeles Departamentul de hidrologie de la Universitatea din Arizona. 

PROBLEME ȘI OBIECTIVE

Într-o anumită privință, geostatistica ar putea fi privită ca o metodă simplă de interpolare a datelor cu privire la un model neregulat, dar acest lucru este prea simplist. Un număr de metode / algoritmi de interpolare au fost deja bine cunoscute când geostatistica a început să fie cunoscută. Inversarea ponderii la distanțe și analiza suprafeței trenurilor, precum și algoritmul de apropiere foarte apropiat al vecinilor. 

În primul rând, geostatistica se ocupă de datele spațiale . Aceasta înseamnă că fiecare valoare a datelor este asociată cu o locație în spațiu și există cel puțin o legătură implicită între locație și valoarea datelor. “Locația” are cel puțin două sensuri; unul este pur și simplu un punct în spațiu (care există doar într-un sens matematic abstract) și în al doilea rând cu o zonă sau un volum în spațiu. De exemplu, o valoare de date asociată cu o zonă ar putea fi valoarea medie a unei variabile observate, calculată în medie pe acel volum. În acest din urmă caz, zona sau volumul este deseori numit “suport” al datelor. Acest lucru este strâns legat de ideea susținerii unei măsuri. Fie x , y , …., wfi puncte (nu doar coordonate) în spațiu dimensional 1, 2 sau 3 și Z ( x ), Z ( y ), … denotă valorile observate în aceste locații. De exemplu, aceasta ar putea fi gradul de cupru, temperatura, conductivitatea hidraulică, concentrația unui poluant. Acum presupunem că t este o locație care nu este “eșantionată”. Obiectivul este de a estima / prezice valoarea Z ( t ) (și locațiile de date, precum și locația t). Dacă se dă numai această informație, atunci problema este nepotrivită, adică nu are o soluție unică. O modalitate de a obține o soluție unică este de a introduce un model în problemă. Există două moduri de a face acest lucru; unul este determinist, iar al doilea este stochastic sau statistic. Ambele abordări trebuie să încorporeze într-un fel ideea că există o incertitudine asociată cu etapa de estimare / predicție. Valoarea în locația neinterprezentă nu este ea însăși aleatoare, dar cunoștințele noastre despre aceasta sunt incerte. O abordare este aceea de a trata Z ( x ), Z ( y ), …. și Z ( t) ca fiind valorile variabilelor aleatoare. Dacă distribuția comună a acestor variabile aleatoare a fost cunoscută, atunci estimatorul “cel mai bun” (cel mai bun sens imparțial și având variația minimă a erorii estimării) ar fi așteptarea condiționată a Z ( t ) date valorilor celorlalte variabile aleatorii. Totuși, datele constau dintr-o singură observație a variabilelor aleatoare Z ( x ), Z ( y ), …. și nici una dintre variabilele aleatoare Z ( t ), prin urmare nu este posibilă estimarea sau modelarea acestei distribuții utilizând standard moduri de modelare sau de montare a distribuțiilor de probabilități.