目次
- 本日の目標
- 自己紹介
- 学修目標と成績評価
- データサイエンスの第一歩
- なぜRなのか / なぜQuartoなのか
- R環境の整備
- Rにふれてみよう:palmer penguins
- Rを使ってデータ分析を深める
0. 本日の目標
- 授業趣旨と成績評価方法をしっかりと理解する
- 表とデータセットの違いをなんとなく理解する
- Rの便利さ、凄さをなんとなく理解する
- Rを使える環境を各自のPC/macに整備する
- Rで散布図を作る
1. 自己紹介
- 名前、学類
- 受講動機
- データ分析したい対象(の有無)
- 高校「情報」科目で習ったこと(該当者のみ)
- プログラミングの経験の有無
2. 学修目標と成績評価
⑴ 学修目標(到達目標)
- 受講生が、R言語の基本的な操作(データの読み込み、加工、抽出、結合など)ができる
- 受講生が、ggplot2パッケージを使い、基本的な図(棒グラフ;ヒストグラム;箱ひげ図;散布図;折れ線グラフ)を作成できる
- 受講生が、自分の関心のあるテーマにかかわるデータから適切な図を作成できる
⑵ 成績評価
⑶ スケジュール
- 4月30日(木):4月29日(水・祝)の振替授業日
⑷ 問い合わせ先
- メール:kariyach@staff.kanazawa-u.ac.jp
- 研究室:総合教育2号館 670号室(Advance Appointment Required)
3. データサイエンスの第一歩
⑴ ツールに依拠した学びが推奨される傾向にあり
- データサイエンス=Pythonを学ぶこと、生成AIを使えるようになること、という誤解
- もっとも重要なのはデータの形についての思想・哲学=データサイエンスの出発点
⑵ データの形
- 表とデータセットを区別する(日本はエンジニアを除いてできていない)
- 表:人間が目で見て理解できる
- データセット:コンピュータが理解できる
- よいデータ構造は、分析を簡単にし、エラーを減らし、再現性を高める
- tidy(整然な)データ
4. なぜRなのか / なぜQuartoなのか
- コード(スクリプト)
- R言語の特性
- 豊富な可視化ツール
- オープンソースと親切なコミュニティ
- 簡易的な記述法(Quarto)
- レポーティング機能と多様な出力形態(Quarto)
- 無料
5. R環境の整備
- 視認性と可読性
- Setup Chunk
6. Rにふれてみよう:palmer penguins
- データセットpenguins
- view()関数;head()関数;colnames()関数;dictinct()関数
- パイプ演算子(‘|>’)
- 散布図:ggplot; geom_point
宿題
- 授業の感想:
- 回答先:Google Forms
- 締め切り:4月10日(金)23時59分
- 初回授業アンケート:
- 回答先:Google Forms
- 締め切り:4月10日(金)23時59分
- ※演習の宿題はありません
Copyright
CHIHIRO KARIYA 2026