NumPy是一款數(shù)字Python開(kāi)發(fā)工具,包含強(qiáng)大的N維數(shù)組對(duì)象、復(fù)雜的(廣播)功能,集成C/C++和Fortran代碼的工具,有用的線性代數(shù),傅立葉變換和隨機(jī)數(shù)功能。
功能介紹
強(qiáng)大的N維數(shù)組
NumPy矢量化,索引和廣播概念快速且通用,是當(dāng)今陣列計(jì)算的實(shí)際標(biāo)準(zhǔn)。數(shù)值計(jì)算工具
NumPy提供了全面的數(shù)學(xué)功能,隨機(jī)數(shù)生成器,線性代數(shù)例程,傅立葉變換等??苫ゲ僮鞯?/p>
NumPy支持廣泛的硬件和計(jì)算平臺(tái),并且可以與分布式,GPU和稀疏陣列庫(kù)一起很好地使用。表演者
NumPy的核心是經(jīng)過(guò)優(yōu)化的C代碼。借助編譯后的代碼,享受Python的靈活性。使用方便
NumPy的高級(jí)語(yǔ)法使其可以為來(lái)自任何背景或經(jīng)驗(yàn)水平的程序員訪問(wèn)并提高生產(chǎn)力。開(kāi)源的
NumPy是在開(kāi)放的BSD許可下發(fā)行的,由一個(gè)活躍,響應(yīng)迅速且多樣化的社區(qū)在GitHub上公開(kāi)開(kāi)發(fā)和維護(hù)。
NumPy位于豐富的數(shù)據(jù)科學(xué)圖書(shū)館生態(tài)系統(tǒng)的核心。
典型的探索性數(shù)據(jù)科學(xué)工作流程可能如下所示:
提取,轉(zhuǎn)換,加載: Pandas, Intake, PyJanitor
探索性分析: Jupyter, Seaborn, Matplotlib, Altair
建模和評(píng)估: scikit-learn, statsmodels, PyMC3, spaCy
儀表板中的報(bào)告: Dash, Panel, Voila
對(duì)于高數(shù)據(jù)量,Dask和 Ray是按比例縮放的。
穩(wěn)定的部署依賴于數(shù)據(jù)版本控制(DVC),實(shí)驗(yàn)跟 蹤(MLFlow)和工作流自動(dòng)化(Airflow和 Prefect)。
軟件特色
分布式陣列和高級(jí)并行分析功能,可實(shí)現(xiàn)大規(guī)模性能。
兼容NumPy的數(shù)組庫(kù),用于使用Python進(jìn)行GPU加速計(jì)算。
NumPy程序的可組合轉(zhuǎn)換:區(qū)分,矢量化,即時(shí)編譯到GPU / TPU。
帶標(biāo)簽的索引多維數(shù)組,用于高級(jí)分析和可視化
兼容NumPy的稀疏數(shù)組庫(kù),該庫(kù)與Dask和SciPy的稀疏線性代數(shù)集成。
深度學(xué)習(xí)框架可加快從研究原型到生產(chǎn)部署的過(guò)程。
機(jī)器學(xué)習(xí)的端到端平臺(tái),可輕松構(gòu)建和部署基于ML的應(yīng)用程序。
深度學(xué)習(xí)框架適用于靈活的研究原型和生產(chǎn)。
用于列式內(nèi)存數(shù)據(jù)和分析的跨語(yǔ)言開(kāi)發(fā)平臺(tái)。
具有廣播和惰性計(jì)算的多維數(shù)組,用于數(shù)值分析。
開(kāi)發(fā)用于數(shù)組計(jì)算的庫(kù),重新創(chuàng)建NumPy的基本概念。
使API與實(shí)現(xiàn)脫鉤的Python后端系統(tǒng);unumpy提供了一個(gè)NumPy API。
Tensor學(xué)習(xí),代數(shù)和后端可無(wú)縫使用NumPy,MXNet,PyTorch,TensorFlow或CuPy
軟件優(yōu)勢(shì)
由諸如XGBoost, LightGBM和 CatBoost之類的工具實(shí)現(xiàn)的ML算法包括稱為集成方法的統(tǒng)計(jì)技術(shù)
Yellowbrick和 Eli5 提供機(jī)器學(xué)習(xí)可視化。
NumPy是迅速發(fā)展的Python可視化領(lǐng)域的重要組成部分
其中包括 Matplotlib, Seaborn, Plotly, Altair, Bokeh, Holoviz,Vispy和 Napari等。
NumPy對(duì)大型數(shù)組的加速處理使研究人員可以可視化遠(yuǎn)超過(guò)本機(jī)Python可以處理的數(shù)據(jù)集。