Jūsų duomenys nebūtinai turi būti tobuli, bet jūs turite žinoti, ką tai reiškia

Pradedančiųjų įkūrėjas, kuriantis analizės įrankius nekilnojamojo turto savininkams, neseniai man pasakė, kad nebėra reikalo gauti gerai suformuotų AI duomenų. Jis pridūrė, kad gerai suformuotų duomenų ir taip nėra realiai, net ir gana naujuose išmaniuosiuose pastatuose. Jis teigė, kad dabartinis AI gali rūšiuoti duomenis, nepaisant jų pradinio nuoseklumo.

Jis ne vienas. Keletas įkūrėjų man pasakė tą patį apie savo programinę įrangą: pateikite jai bet kokius duomenis bet kokiu formatu ir ji duos naudingų rezultatų. AEC, kur dešimtmečius stengėmės, kad duomenys būtų sąveikūs ir to nepasiektų, ši mintis skamba išlaisvinančiai.

Taigi ar vis dar verta stengtis siekti semantinių ir struktūrinių duomenų kokybės prieš taikant AI? Tai priklauso.

Turinys

Kodėl ne visada reikalingi švarūs duomenys

Nekilnojamojo turto byla yra pagrįsta specifine ir realia problema. Sukurtos savybės sukuria daugybę pastato telemetrijos duomenų, tačiau didžioji jos dalis yra nestruktūrizuota, sutvarkyta ir saugoma senuose formatuose, kurių dauguma sistemų negali nuskaityti be didelio pasiruošimo. Dar visai neseniai norint, kad šie duomenys būtų naudojami dirbtiniam intelektui, reikėjo rankiniu būdu žymėti ir sudaryti žemėlapius, o tai gali kainuoti dešimtis tūkstančių eurų už pastatą ir užtrukti mėnesius. Už tokią kainą dauguma projektų niekada nebuvo pradėti.

Naujos AI galimybės pakeitė tą slenkstį. Dabar sistemos gali gauti suskaidytus, nenuosekliai pažymėtus duomenis iš pastato valdymo sistemų ir pradėti išgauti naudingus modelius be rankinio paruošimo. Įsiurbimo problema, kuri kažkada buvo tikras projekto žudikas, tampa įveikiama.

Įmonės, kurios atidėlioja AI darbo eigos kūrimą, kol jų duomenys bus tvarkingi, lauks neribotą laiką. Įkūrėjas pasakė tiesiau: prieinamumas svarbiau nei kokybė. Jei duomenų negalima pasiekti ir panaudoti, jų kokybė neturi reikšmės.

Ką AI iš tikrųjų daro su jūsų duomenimis

Yra dar vienas problemos aspektas, kurį apeina argumentas „bet kokie duomenys“. Struktūrinė kokybė reiškia, kaip gerai suformatuoti ir nuosekliai sutvarkyti duomenys. Semantinė kokybė reiškia, ar etiketės ir aprašymai iš tikrųjų perteikia duomenų reikšmę. Tai skirtingos problemos, o dirbtinis intelektas atskleidžia skirtumus, kurių nebuvo ankstesnė programinė įranga. Didelės kalbos modeliai nesupranta pastatų. Jie supranta juos apibūdinančią kalbą. Šis skirtumas lemia viską, kiek patikima bus išvestis.

Modelinis samprotavimas apie techninės priežiūros grafiką, sąnaudų sąmatą ar struktūrinę sistemą yra samprotavimai apie žodžius ir skaičius, vartojamus tiems dalykams apibūdinti, o ne apie fizinę realybę, kurią jie reprezentuoja. Jei aprašymas yra dviprasmiškas, neišsamus arba pažymėtas nenuosekliai, modelis vis tiek pateiks atsakymą. Tai tiesiog gali būti netinkama.

Tai reiškia, kad semantinė darna, ar duomenys aprašyti pakankamai aiškiai ir nuosekliai, kad būtų galima samprotauti, yra ne mažiau svarbūs nei struktūrinis švarumas. Puikiai suformatuotas duomenų rinkinys su slaptais laukų pavadinimais gali būti mažiau naudingas dirbtinio intelekto sistemai nei netvarkinga skaičiuoklė su tiksliomis, aprašomomis etiketėmis. Tai yra dvi skirtingos problemos, o jų supainiojimas lemia prastus sprendimus, kur investuoti į duomenų kokybę.

Netvarkingų duomenų kaina neišnyksta

Aalto universiteto mokslininkas, dirbantis su statybine AI programa, turėjo praleisti daug laiko rankiniu būdu iškirpdamas, įklijuodamas ir derindamas duomenis iš kelių šaltinių, kol jie buvo pradėti naudoti. Tokio darbo dabar iš esmės galima išvengti. AI gali atlikti didžiąją dalį mechaninio duomenų derinimo darbo, tačiau tik tuo atveju, jei suteikiate pakankamai konteksto, ką jis žiūri ir ką jis turėtų su juo daryti.

Žmogaus pastangos neišnyksta; keičiasi jo paskirtis. Užuot valę duomenis prieš procesą, dabar nustatote kontekstą pradžioje ir patvirtinate išvestį pabaigoje. Atliekant tiriamąsias arba mažų statymų darbo eigą, tą prekybą dažnai verta atlikti. Kiekio padidėjimo, gyvavimo ciklo sąnaudų analizės ar bet kokios situacijos, kai įsitikinęs klaidingas atsakymas turi realių pasekmių, rizika yra kitame lygyje.

AI gali dirbti su netvarkingais duomenimis, jei turite žinių ir priemonių juos paversti patikima informacija. Šis konteksto nustatymo darbas nėra vienkartinė investicija; tai yra konkretaus projekto, nes duomenų aplinka ir statymai kiekvieną kartą skiriasi.

Duomenų kokybė kaip vertės grandinės turtas

Iki šiol duomenų kokybė buvo vertinama iš vieno naudojimo atvejo perspektyvos vienoje įmonėje. Kiekybės inspektoriaus duomenų rinkinys buvo pakankamai geras, jei jis tarnavo kiekio inspektoriui. Vertė neviršijo šios programos, o jos tobulinimo išlaidos retai pateisino pastangas.

Kadangi projekto dalyviai negalėjo lengvai naudotis vieni kitų duomenimis, jie daugiausia juos atkūrė patys. Šis neefektyvumas yra taip įterptas į AEC, kad dauguma įmonių to nebepastebi.

Kai dirbtinio intelekto sistemos naudoja duomenis neperžengdamos organizacijos ribų, įtraukdamos į pirkimų sprendimus, veiklos analizę, portfelio valdymą ar trečiųjų šalių platformas, įmonė, kuri gamina gerai aprašytus, nuoseklius duomenis, turi kažką, ką gali panaudoti kiti. Įsivaizduokite rangovą, gaminio gamintoją ar pastato savininką, teikiantį dirbtiniam intelektui paruoštus duomenis, kuriuos dešimtys tolesnių suinteresuotųjų šalių gali iš karto sunaudoti be pertvarkymo.

Vertės grandinėje, kurioje AI vis labiau jungia taškus, patikimi ir semantiškai turtingi įvesties elementai gali tapti prekiaujama. Tai vis dar atsiranda, o komerciniai jo modeliai dar nėra aiškūs. Tačiau įmonės, kurios daugelį metų kuria duomenų discipliną ne tik siekdamos atitikties, bet ir dėl veiklos aiškumo, yra gerai pasirengusios duomenimis grindžiamam bendradarbiavimui. Visos pramonės pastangos, pvz., Suomijos darbas su standartizuotais produktų duomenimis, rodo ateitį, kurioje tokio pobūdžio turtas turės realią rinkos vertę.

Ką daryti dabar

AI galimybių patobulinimai neturėtų būti traktuojami kaip leidimas nepaisyti duomenų kokybės. Jie turėtų būti traktuojami kaip galimybė greičiau pradėti ir geriau suprasti duomenų potencialą. Kurkite darbo eigą, naudokite tai, ką turite, ir įtaisykite procesą, kad pamatytumėte, kur nuoseklumas yra labai svarbus, o kur neverta investuoti.

Geresnė duomenų kokybė atsiperka net ir be AI. Kai jūsų duomenys nuosekliai ir tiksliai aprašo, kas tai yra, jūs praleidžiate mažiau laiko atkurdami tai, ką kiti jau žino, ir daugiau laiko tai darote.

Įmonės, kurios dabar į tai žiūri rimtai, ne tik turės geresnių dirbtinio intelekto rezultatų. Jie gali turėti turto, už kurį galiausiai norės sumokėti kiti.

Nuoroda į informacijos šaltinį