Datavitenskap

Fra Wikipedia, den frie encyklopedi

Datavitenskap er et tverrfaglig felt som bruker statistikk, vitenskapelige metoder, prosesser, algoritmer og systemer for å generere kunnskap og innsikt fra støyete, strukturerte og ustrukturerte data.[1][2] Datavitenskap er relatert til datautvinning, maskinlæring og stordata.

Datavitenskap er et har blitt beskrevet som et konsept for å forene statistikk, dataanalyse, informatikk og deres relaterte metoder for å forstå og analysere faktiske fenomen med data.[3] Det tas i bruk teknikker og teori fra felt som matematikk, statistikk, datateknikk, informatikk, informasjonsvitenskap og domenekunnskap.[4] Datavitenskap er imidlertid forskjellig fra datateknikk (computer science) og informasjonsvitenskap. Turing-prisvinneren Jim Gray så for seg datavitenskap som et et fjerde paradigme av vitenskap (empirisk, teoretisk, beregnet, og nå datadrevet), og hevdet at alt om vitenskap endrer seg på grunn av innvirkningen fra informasjonsteknologi og informasjonseksplosjonen.[5][6]

En dataviter er en person som lager programmeringskode og kombinerer den med statistisk kunnskap for å skape innsikt fra data.[7]

Det er fortsatt ingen konsensus om definisjonen av datavitenskap, og det anses av noen å være en moteord.[8] Stordata er et relatert markedsføringsbegrep.[9] Datavitere er ansvarlige for å bryte ned stordata til brukbar informasjon og lage programvare og algoritmer som hjelper selskaper og organisasjoner med å styre driften optimalt.[10]

Se også[rediger | rediger kilde]

Referanser[rediger | rediger kilde]

  1. ^ Dhar, V. «Data science and prediction». 
  2. ^ Jeff Leek. «The key word in "Data Science" is not Data, it is Science». Simply Statistics. Arkivert fra originalen 2. januar 2014. Besøkt 1. januar 2014. 
  3. ^ Hayashi, Chikio (1. januar 1998). «What is Data Science? Fundamental Concepts and a Heuristic Example». I Hayashi. Data Science, Classification, and Related Methods. Studies in Classification, Data Analysis, and Knowledge Organization (engelsk). Springer Japan. ISBN 9784431702085. doi:10.1007/978-4-431-65950-1_3. 
  4. ^ Cao, Longbing (29. juni 2017). «Data Science: A Comprehensive Overview». 
  5. ^ Tony Hey; Stewart Tansley; Kristin Michele Tolle. The Fourth Paradigm: Data-intensive Scientific Discovery. Microsoft Research. ISBN 978-0-9825442-0-4. Arkivert fra originalen 20. mars 2017. 
  6. ^ Bell, G. «COMPUTER SCIENCE: Beyond the Data Deluge». 
  7. ^ Davenport, Thomas H.; Patil, D. J. (oktober 2012). «Data Scientist: The Sexiest Job of the 21st Century». Harvard Business Review. 90 (10): 70–76, 128. PMID 23074866. 
  8. ^ Press, Gil. «Data Science: What's The Half-Life of a Buzzword?». Besøkt 3. april 2020. 
  9. ^ Pham, Peter. «The Impacts of Big Data That You May Not Have Heard Of». Besøkt 3. april 2020. 
  10. ^ Martin, Sophia. «How Data Science will Impact Future of Businesses?». Besøkt 3. april 2020.