Author

Affiliation

苅谷千尋

金沢大学教育支援センター

Published

Wed, 15, Apr, 2026

Modified

Fri, 19, Jun, 2026

目次

前回の振り返り
データフレームの構造と型
データの抽出
データの要約と集計
生成AIを活用する
Rの構造：base R と modern R(tidyverse)の関係

0. 本日の目標

データフレームの基本的な構造（行・列・変数）を理解する
データの型（数値・文字・ファクターなど）の違いをなんとなく理解する
データの抽出・除外についての基本的な操作を行ってみる
データを簡単に計算し、その結果を図にしてみる（詳しい説明、理解は次週以降）
生成AIの注意点を理解してRの補助ツールとして活用する
base Rとmodern Rの関係をなんとなく理解する

2. データフレームの構造と型

Rの基本操作：列名中心
- → 列名をわかりやすく、かつ、一意な名前を付けることが重要 Cf. colnames()関数
データフレーム = データを表の形でまとめたもの
- 明確な列名とそれに従った値からなる
  - 行（row）: 1つの観測（例：1羽のペンギン）
  - 列（column）: 1つの変数（例：体重・種類）
型によって「できる操作」が異なる
- 数値：計算に向いている
- 文字：分類に向いている
- カテゴリ：分類に使われるデータ（順序を持つこともある）
skim()関数によるデータの特徴・型の把握

3. データの抽出

filter()関数：指定した変数のデータのみ残す
filter_out()関数：指定した変数のデータを除外する
欠損値
- RはNAの扱いを明示しないと計算しない仕様
- 欠損値の除外：drop_na()関数が基本
- 欠損値の置き換え：replace_na()関数

4. データの要約と集計（基本編）

平均値を算出する：summarise()関数とmean()関数を組み合わせる
- summarise(avg_body_mass = mean(body_mass))
グループごとの平均値を算出する：group()関数
- group_by(species)

5. 生成AIを活用する

⑴ 生成AIの利点を知る

コードと生成AIは相性がよい

⑵ 生成AIの限界を知る

古い情報・不正確な情報や、存在しない関数、間違ったコードを出すことがある
AIは目的や問い、仮説を立てることはできない
- →︎ 何を分析したいかは自分で考える必要がある

6. Rの構造：base R と modern R(tidyverse)の関係

⑴ 3層構造

Packages
- 目的別に追加するツール：家具や家電
modern R：tidyな（整然とした）R:
- 近年の改良で、より読みやすく・便利になった文法：家の骨組み・壁・柱、設計の考え
- 関数は動詞ベース（何をするかがわかりやすい）
  - 例：filter; select Cf. base R: subset（数学の「部分集合」に由来）
base R：R言語そのもの：家の基礎部分

⑵ パイプ処理

|> または %>%
前の結果を次の関数に渡して、処理を順番につなげる役割を担う
- コードはオブジェクト（データ）から始まる
- 何をどうしたいのかが明確（書きやすく、読みやすい）
- → コードを単純化でき、上から順に読めるコードになる

宿題

授業の感想：

回答先：Google Forms
締め切り：4月17日（金）23時59分

演習：

内容：授業内で課した演習①〜④
ファイル：演習の該当箇所を抜き出すのではなく、qmdファイルをそのまま提出
- ファイル名：どこかに*氏名を特定できる文字を入れて下さい（例：inClassExercise_kariya.qmd）
回答先：dropbox
締め切り：4月20日（月）23時59分

Copyright

CHIHIRO KARIYA 2026