Pandas

Pandas je softwarová knihovna napsaná pro programovací jazyk Python pro manipulaci a analýzu dat. Zejména nabízí datové struktury a operace pro manipulaci s číselnými tabulkami a časovými řadami. Je to svobodný software vydaný pod licencí BSD se třemi klauzulemi. Název je odvozen od termínu „panel data“, což je ekonometrický termín pro datové soubory, které zahrnují pozorování za více časových období u stejných jedinců. Jeho název je hrou se samotnou frází „analýza dat Pythonu“. Wes McKinney začal budovat pandy v AQR Capital, když tam v letech 2007 až 2010 působil jako výzkumník.

 

Funkce knihovny:

  • Objekt DataFrame pro manipulaci s daty s integrovaným indexováním.
  • Nástroje pro čtení a zápis dat mezi datovými strukturami v paměti a různými formáty souborů.
  • Zarovnání dat a integrované zpracování chybějících dat.
  • Přetváření a pivotování datových sad.
  • Krájení na základě štítků, luxusní indexování a podmnožiny velkých souborů dat.
  • Vkládání a mazání sloupců datové struktury.
  • Seskupit podle enginu umožňující operace split-apply-combine na souborech dat.
  • Slučování a spojování datových sad.
  • Hierarchické indexování os pro práci s vysokorozměrnými daty ve struktuře nižších rozměrů.
  • Funkčnost časových řad: Generování datového rozsahu a frekvenční konverze, statistika pohyblivého okna, lineární regrese pohyblivého okna, posun data a zpoždění.
  • Poskytuje filtraci dat.
  • Knihovna je vysoce optimalizovaná pro výkon, s kritickými cestami kódu napsanými v Cythonu nebo C.

Úvod

Postup instalace se odlišuje pod MS Windows a Linux. Pokud nechcete podporu Pythonu instalovat použijte online.

Datové centrum
Ústeckého kraje, p. o.

Velká Hradební 3118/48
Ústí nad Labem
400 01

Provozovna:

Masarykova 750/316
(Rondel)
Ústí nad Labem
400 01

telefon:  +420 604 609 670
IČ:  09658351
email: dcuk@dcuk.cz
datová schránka:  7kpvchm
bankovní číslo:  2801906856/2010