Jak vypočítat průměry pomocí funkce pandas mean()

Obsah

Funkce DataFrame.mean() v Python pandas se používá k výpočtu průměrů v jedné nebo více osách DataFrame. Pandas mean() je nezbytný pro analýzu numerických dat. Kromě výpočtu průměrných hodnot nabízí také přehled o distribuci dat.

Jaká je syntaxe pro `DataFrame.mean()`?

Funkce pandas mean() přijímá až tři parametry a má následující syntaxi:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)

python

Jaké parametry lze použít s pandas `Dataframe.mean`?

Pomocí různých parametrů můžete přizpůsobit fungování pandas DataFrame.mean().

Parametr	Popis	Výchozí hodnota
`axis`	Určuje, zda se výpočet provádí nad řádky (`axis=0`) nebo sloupci (`axis=1`).	`0`
`skipna`	Pokud je nastaveno na `True`, hodnoty NaN budou ignorovány.	`True`
`numeric_only`	Pokud je nastaveno na `True`, do výpočtu budou zahrnuty pouze numerické datové typy.	`False`

Jak používat pandas `mean()`

Funkci pandas DataFrame.mean() můžete použít jak na sloupce, tak na řádky.

Výpočet průměrných hodnot pro sloupce

Nejprve vytvoříme pandas DataFrame s některými numerickými daty:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)

python

Výsledný DataFrame vypadá takto:

A  B    C
0  1  4    7
1  2  5    8
2  3  6    9
3  4  7  10

K výpočtu průměru každého sloupce můžete použít funkci pandas mean(). Ve výchozím nastavení je parametr osy nastaven na 0, což odpovídá sloupcům.

column_means = df.mean()
print(column_means)

python

Výše uvedený kód vypočítá průměr pro každý sloupec (A, B a C) tak, že najde součet prvků v příslušném sloupci a poté jej vydělí počtem prvků ve sloupci. Výsledkem je následující pandas Series:

A    2.5
B    5.5
C    8.5
dtype: float64

Výpočet průměrných hodnot pro řádky

Pokud chcete zjistit průměr pro řádky, stačí nastavit parametr axis na hodnotu 1:

row_means = df.mean(axis=1)
print(row_means)

python

Pandas mean() vypočítává průměry řádků tak, že vydělí součet prvků v řádku počtem prvků, které obsahuje. Volání výše uvedené funkce vygeneruje následující výstup:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

Zpracování hodnot NaN

V tomto příkladu použijeme jiný DataFrame, který obsahuje hodnoty NaN:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)

python

Výše uvedený kód vytvoří následující DataFrame:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Při výpočtu průměrů pro sloupce parametr skipna určuje, zda mají být hodnoty NaN zahrnuty nebo ignorovány. Výchozí hodnota skipna je nastavena na True, takže df.mean() automaticky ignoruje hodnoty NaN. Pokud chcete zahrnout hodnoty NaN, musíte přidat parametr skipna=False. Tím se zajistí, že každý sloupec s alespoň jednou hodnotou NaN vrátí jako průměr hodnotu NaN.

mean_with_nan = df.mean() 
print(mean_with_nan)

python

Volání df.mean() vygeneruje následující výstup:

A    2.333333
B    5.666667
C    8.000000
dtype: float64

Související články

Jak sloučit DataFrames pomocí pandas merge()

Metoda pandas DataFrame merge() nabízí vývojářům různé způsoby, jak kombinovat data z různých zdrojů. Pomocí parametrů mohou uživatelé provádět různé typy spojovacích operací pro analýzu dat. V tomto článku se podíváme na syntaxi funkce pandas merge(), parametry, které přijímá, a…

Číst více

Mr. Kosalshutterstock

Co je Pandas fillna() a jak jej používat

Metoda fillna() v Pandas je funkce používaná k řešení chybějících hodnot. S funkcí lze použít různé parametry, což nabízí flexibilitu při nahrazování hodnot NaN. V tomto článku se podíváme na tuto funkci, její syntaxi a parametry a na to, jak přizpůsobit náhradní hodnoty pro…

Číst více

Jak identifikovat chybějící hodnoty pomocí funkce pandas isna()

Funkce pandas isna() je užitečným nástrojem pro identifikaci chybějících dat v DataFrame. Díky své jednoduché syntaxi vám rychle poskytne jasný přehled chybějících hodnot a pomůže vám podniknout kroky, když je třeba data vyčistit. V tomto článku se dozvíte, co je pandas isna() a…

Číst více

BEST-BACKGROUNDSShutterstock

Jak vyhledávat DataFrames pomocí pandas isin()

Pandas isin() je užitečná funkce pro analýzu dat. Díky své jednoduché syntaxi a všestrannému použití vám umožňuje efektivně kontrolovat hodnoty v DataFrame. Ať už ověřujete jednotlivé sloupce, filtrujete DataFrames nebo provádíte složitější analýzy se slovníky, funkce isin() je…

Číst více

NDAB Creativityshutterstock

Co je pandas groupby() a jak jej používat

Funkce pandas DataFrame.groupby() je výkonný nástroj pro organizaci dat. Umožňuje seskupovat data podle konkrétních kritérií, což usnadňuje provádění složitých agregací a transformací. Efektivním používáním této metody můžete zefektivnit své analytické procesy, zrychlit je a lépe…

Číst více

Jak filtrovat odlišné hodnoty pomocí pandas DataFrame[].unique()

Pomocí pandas DataFrame[].unique() můžete identifikovat odlišné hodnoty ve sloupci DataFrame. Vrací numpy pole, které vám pomůže efektivněji zpracovávat velké datové sady. Tato metoda je obzvláště užitečná, pokud chcete získat přehled o informacích ve sloupci bez duplicitních…

Číst více

Jak vypočítat průměry pomocí funkce pandas mean()

Jaká je syntaxe pro DataFrame.mean()?

Jaké parametry lze použít s pandas Dataframe.mean?

Jak používat pandas mean()

Výpočet průměrných hodnot pro sloupce

Výpočet průměrných hodnot pro řádky

Zpracování hodnot NaN

Jaká je syntaxe pro `DataFrame.mean()`?

Jaké parametry lze použít s pandas `Dataframe.mean`?

Jak používat pandas `mean()`