Pythonを活用しWebinarのデータ(CSV)をアップロードして相関関係を出す方法

Python
この記事は約2分で読めます。

Webinarのデータ(CSV)をアップロードして相関関係を出す方法を説明します。Pythonを使うと簡単に実施できます。

1. 必要なライブラリをインストール

まず、Pythonでデータを処理するために必要なライブラリをインストールします。

pip install pandas seaborn matplotlib

2. CSVデータを読み込み

CSVファイルをPandasで読み込みます。

import pandas as pd

# CSVファイルを読み込む(例: webinar_data.csv)
df = pd.read_csv(“webinar_data.csv”)

# データの最初の数行を確認
print(df.head())

3. 相関分析を実施

Pandasの.corr()関数を使って、相関係数を計算します。

# 相関係数の計算
correlation_matrix = df.corr()
# 相関係数を表示
print(correlation_matrix)

4. ヒートマップで可視化

Seabornを使って相関関係をヒートマップで視覚化します。

import seaborn as sns
import matplotlib.pyplot as plt
# ヒートマップの描画
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap=“coolwarm”, fmt=“.2f”)

# タイトルを追加
plt.title(“Webinar Data Correlation Matrix”)
plt.show()

5. 分析結果の解釈

  • 相関係数(-1から1までの範囲)
    • 1に近い → 正の強い相関(例: 参加時間が長いほどアンケート満足度が高い)
    • 0に近い → ほぼ無関係
    • -1に近い → 負の強い相関(例: 参加時間が長いほど質問回数が少ない)

コメント