Google govori o pomenu odprtokodnih in odprtih podatkov v nedavni objavi v spletnem dnevniku

Tech / Google govori o pomenu odprtokodnih in odprtih podatkov v nedavni objavi v spletnem dnevniku 3 minute branja

Google



Google kot podjetje že od nekdaj podpira odprtokodno programsko opremo in podatke, vsaj na njihovem stališču. Zdaj je to skoraj trend pri velikih podjetjih, saj sta Google in Microsoft pomembno prispevala k odprtokodni sceni. “ Google tudi veliko prispeva k odprtokodni programski opremi. Ključni primeri tega vključujejo Android , naš operacijski sistem za pametne telefone, Krom , osnova kode za naš brskalnik Chrome (zdaj tudi napajanje številnih konkurentov ) in TensorFlow , naš sistem strojnega učenja. Googlova izdaja Guvernerji za vedno spremenil gostovanje v oblaku in omogočil inovacije in konkurenco v oblačni industriji. Google je tudi največji sodelavec odprtokodne kode za GitHub , skupno repozitorij za razvoj programske opreme. Leta 2017 so zaposleni v Googlu samo na GitHubu naredili več kot 250.000 sprememb na deset tisoče projektov. '

V večini primerov v resnici ne gre za radodarnost, ampak bolj za to, da izkoristimo prosti razvoj in nato izkoristimo široko posvojitev. Ne glede na to so ti prispevki pomagali na tisoče raziskovalcem in usmerjali razvoj programske opreme na enoten način, kar je treba proslaviti. Google je v nedavni objavi na blogu poudaril njihov prispevek k odprtim podatkom in odprtokodni programski opremi.



S prihodom sledenja v realnem času in razvojem avtomobilov brez voznika se veliko raziskuje na področju računalniškega vida in Google je eno od vodilnih podjetij na področju Visual Tech.



Zaveza za odprtokodne in odprte podatke nas je pripeljala do tega, da smo nize podatkov, storitve in programsko opremo delili z vsemi. Google je na primer izdal Odprite nabor podatkov Images od 36,5 milijona slik, ki vsebujejo skoraj 20.000 kategorij predmetov, označenih s človekom. S temi podatki lahko raziskovalci računalniškega vida urijo sisteme za prepoznavanje slik. Podobno milijoni videoposnetkov s komentarji v YouTube-8M Zbirka se lahko uporablja za usposabljanje prepoznavanja videa.



- Variantna stvar

Glavni ekonomist, Google

Google uporablja tudi veliko podatkov, ki lahko NLP pomagajo pri raziskavah in pomagajo računalnikom bolje razumeti človeški govor. V objavi v spletnem dnevniku je Google poudaril skupno rabo ključne baze podatkov z navedbo » V zvezi z jezikovno obdelavo smo delili Naravna vprašanja zbirka podatkov, ki vsebuje 307.373 človeških vprašanj in odgovorov. Na voljo smo tudi Trilion besednih korpusov , ki temelji na besedah, uporabljenih na javnih spletnih straneh, in Pregledovalnik Ngram , ki ga je mogoče uporabiti za raziskovanje več kot 25 milijonov knjig v Ljubljani Google Knjige . Te zbirke je mogoče uporabiti za statistično strojno prevajanje , prepoznavanje govora, popravek črkovanja , odkrivanje entitet, pridobivanje informacij in druge jezikovne raziskave. '



Iskalnik je eno glavnih Googlovih podjetij, ki vsako sekundo dobi več kot 63.000 poizvedb. Ti podatki so za podjetje zelo pomembni in Google jih analizira za ciljno oglaševanje. Kljub temu so nekateri vpogledi v splošne podatke objavljeni na Googlovem portalu trendov.

' Google ponuja tudi Google Trendi , brezplačna storitev, ki vsakomur omogoča ogled in prenos skupnih iskalnih dejavnosti od leta 2004 za Iskanje Google, Iskanje slik, Iskanje novic, Nakupovanje in YouTube. Informacije o državah, regijah, območjih podzemne železnice in mestih lahko dobite mesečno, tedensko, dnevno in celo na uro. Podatke Trends raziskovalci pogosto uporabljajo na različnih področjih, kot sta medicina in ekonomija. Po navedbah Google Scholar obstajajo več kot 21.000 raziskovalnih člankov ki kot vir podatkov navajajo Trends. '

Zakaj delati na odprtokodnih projektih?

O tem sem na kratko spregovoril na začetku članka. Nov del programske opreme lahko uresniči odlično idejo in uvede prostor, vendar to drugim ne preprečuje, da bi podobne ideje uresničevali in si nato prizadevali za izboljšanje. Številna podjetja so se tega naučila na težji način, na primer Windows Phone. Kot vemo, je šlo za izjemen neuspeh iz številnih razlogov, toda velik del tega je bilo zaprto okolje in nadzor nad licenciranjem. Hardoop in HDFS sta bili odprtokodni različici MapReduce, ki jo je ustvaril Google, in podjetje se je že zgodaj naučilo pomena odprtokodne kode. Če povzamemo, odločitev za odprtokodno kodo IP je strateška.

Google se v svojem zapisu v blogu poglobi v nekaj drugih razlogov in navaja: V prvi vrsti je naše glavno poslanstvo 'organizirati svetovne informacije in jih narediti splošno dostopne in uporabne.' Zagotovo je en očiten način, da postanejo informacije splošno dostopne in uporabne, njihova podelitev ! '

Pogovarjajo se tudi o tem, zakaj ne morejo izdati nekaterih stvari z navedbo ' Seveda ne moremo objaviti vseh podatkov, ki jih uporabljamo v svojem poslu. Zaščititi moramo zasebnost uporabnikov, ohraniti zaupnost za poslovne stranke in zaščititi Googlovo lastno intelektualno lastnino. Toda ob takšnih premislekih na splošno poskušamo narediti svoje podatke čim bolj 'splošno dostopne in uporabne'. '

Oznake google