| species | island | bill_len | bill_dep | flipper_len | body_mass | sex | year |
|---|---|---|---|---|---|---|---|
| Adelie | Torgersen | 39.1 | 18.7 | 181 | 3750 | male | 2007 |
| Adelie | Torgersen | 39.5 | 17.4 | 186 | 3800 | female | 2007 |
| Adelie | Torgersen | 40.3 | 18.0 | 195 | 3250 | female | 2007 |
#2 Rの基本的な操作方法(1)
April 15, 2026
今まではデータに対する図や表はエクセルで十分だと考えていたのですが、今回の授業でその良さを知り、特に元データをいじらないという点を聞いた際に、エクセルで元データをいじったせいで面倒臭いことになったことを思い出して、自分の中でとても納得がいったからです(寺西さん)
私はパソコンの操作に自信がなく、授業前まで計算関連の数学的な部分で授業についていけなくなるのではないかと不安を感じていた(宮園さん)
どこを押せば先生と同じページになるのかが分からなくて手こずってしまった(吉田さん)
library(tidyverse)というコードの有無| species | island | bill_len | bill_dep | flipper_len | body_mass | sex | year |
|---|---|---|---|---|---|---|---|
| Adelie | Torgersen | 39.1 | 18.7 | 181 | 3750 | male | 2007 |
| Adelie | Torgersen | 39.5 | 17.4 | 186 | 3800 | female | 2007 |
| Adelie | Torgersen | 40.3 | 18.0 | 195 | 3250 | female | 2007 |
| V1 | V2 | V3 | V4 |
|---|---|---|---|
| 野菜 | 野菜 | 野菜 | 野菜 |
| 春野菜 | 春野菜 | 夏野菜 | 夏野菜 |
| ニンジン | キャベツ | トマト | キュウリ |
| 100 | 150 | 200 | 180 |
| 120 | 130 | 210 | 170 |
| 大カテゴリ | 中カテゴリ | 野菜名 | 1月売上 | 2月売上 |
|---|---|---|---|---|
| 野菜 | 春野菜 | ニンジン | 100 | 120 |
| 野菜 | 春野菜 | キャベツ | 150 | 130 |
| 野菜 | 夏野菜 | トマト | 200 | 210 |
| 野菜 | 夏野菜 | キュウリ | 180 | 170 |
| ...1 | ...2 | ...3 | ...4 | ...5 | ...6 | ...7 | ...8 | ...9 | ...10 | ...11 | 第 3 表 主 要 家 計 指 標 | ...13 | ...14 | ...15 | ...16 | ...17 | ...18 | ...19 | ...20 | ...21 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| NA | NA | NA | NA | NA | NA | 総世帯 | NA | NA | NA | NA | NA | 二人以上の世帯 | NA | NA | NA | NA | NA | 単身世帯 | NA | 消費者 物価指数 |
| NA | NA | NA | NA | NA | NA | NA | NA | うち勤労者世帯 | NA | NA | NA | NA | NA | うち勤労者世帯 | NA | NA | NA | NA | NA | NA |
| NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| 年、年度、期 | NA | NA | NA | NA | NA | 世帯人員 | NA | 世帯人員 | NA | NA | NA | 世帯人員 | NA | 世帯人員 | NA | NA | NA | NA | NA | 持家の 帰属家賃 を除く 総合 |
| NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| NA | NA | NA | NA | NA | NA | NA | 消費支出 | NA | 実収入 | 可処分 | 消費支出 | NA | 消費支出 | NA | 実収入 | 可処分 | 消費支出 | 消費支出 | NA | NA |
| NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 所 得 | NA | NA | NA | NA | NA | 所 得 | NA | NA | NA | NA |
| NA | NA | NA | NA | NA | NA | (人) | NA | (人) | NA | NA | NA | (人) | NA | (人) | NA | NA | NA | NA | NA | NA |
| NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| NA | NA | NA | 2022年平均 | NA | NA | 2.2200000000000002 | 244231 | 2.5 | 535177 | 435001 | 273417 | 2.91 | 290865 | 3.24 | 617654 | 500914 | 320627 | 161753 | NA | 102.7 |
| NA | NA | NA | 2023 | NA | NA | 2.2000000000000002 | 247322 | 2.4700000000000002 | 522334 | 425967 | 272285 | 2.9 | 293997 | 3.23 | 608182 | 494668 | 318755 | 167620 | NA | 106.6 |
| NA | NA | NA | 2024 | NA | NA | 2.17 | 250929 | 2.4500000000000002 | 542886 | 446596 | 275568 | 2.88 | 300243 | 3.23 | 636155 | 522569 | 325137 | 169547 | NA | 110 |
| NA | NA | NA | 2025 | NA | NA | 2.15 | 259880 | 2.42 | 559173 | 454952 | 291397 | 2.87 | 314001 | 3.2 | 653901 | 532408 | 346297 | 173042 | NA | 114 |
| NA | NA | NA | 2021年度平均 | NA | NA | 2.2400000000000002 | 236573 | 2.52 | 522476 | 426796 | 266380 | 2.93 | 280935 | 3.27 | 608156 | 495783 | 311207 | 156339 | NA | 99.9 |
| NA | NA | NA | 2022 | NA | NA | 2.21 | 247219 | 2.5 | 538384 | 437146 | 275541 | 2.9 | 293671 | 3.24 | 620012 | 502262 | 322841 | 165796 | NA | 103.7 |
| NA | NA | NA | 2023 | NA | NA | 2.19 | 246676 | 2.46 | 522157 | 425532 | 271299 | 2.89 | 294116 | 3.23 | 609904 | 496111 | 319159 | 166318 | NA | 107.4 |
| 実 | NA | NA | 2024 | NA | NA | 2.17 | 254435 | 2.44 | 545752 | 449268 | 279487 | 2.88 | 304178 | 3.22 | 639372 | 524833 | 329598 | 172968 | NA | 111.2 |
| NA | NA | NA | 2021年 | 10~12 | 月期 | 2.2400000000000002 | 245931 | 2.5 | 609344 | 506562 | 272373 | 2.93 | 292077 | 3.27 | 711066 | 592057 | 320333 | 163007 | NA | 100 |
| NA | NA | NA | 2022年 | 1~3 | NA | 2.23 | 234726 | 2.5 | 435798 | 360160 | 262372 | 2.92 | 284316 | 3.26 | 507882 | 419944 | 314444 | 146054 | NA | 100.8 |
| NA | NA | NA | NA | 4~6 | NA | 2.2200000000000002 | 240742 | 2.48 | 562844 | 446215 | 266472 | 2.91 | 289694 | 3.25 | 648729 | 510810 | 319865 | 153611 | NA | 102 |
| NA | NA | NA | NA | 7~9 | NA | 2.2200000000000002 | 237456 | 2.48 | 498561 | 404005 | 266951 | 2.91 | 285429 | 3.23 | 573555 | 463036 | 318001 | 152856 | NA | 103.2 |
| 数 | NA | NA | NA | 10~12 | NA | 2.21 | 255388 | 2.4900000000000002 | 651882 | 535924 | 282220 | 2.9 | 304022 | 3.24 | 740450 | 609865 | 330200 | 170672 | NA | 104.6 |
| NA | NA | NA | 2023年 | 1~3 | NA | 2.2000000000000002 | 245524 | 2.48 | 446444 | 366503 | 271804 | 2.9 | 295539 | 3.24 | 517314 | 425338 | 323299 | 159241 | NA | 105.1 |
| NA | NA | NA | NA | 4~6 | NA | 2.2000000000000002 | 238444 | 2.4700000000000002 | 557127 | 443803 | 264985 | 2.9 | 288355 | 3.23 | 640984 | 507788 | 314821 | 153027 | NA | 106 |
| NA | NA | NA | NA | 7~9 | NA | 2.19 | 241159 | 2.44 | 478391 | 389607 | 264714 | 2.89 | 285955 | 3.22 | 556469 | 453700 | 309844 | 164807 | NA | 107 |
| (円) | NA | NA | NA | 10~12 | NA | 2.19 | 256267 | 2.42 | 619305 | 509645 | 275663 | 2.89 | 306138 | 3.23 | 717961 | 591845 | 327056 | 171961 | NA | 108.2 |
| NA | NA | NA | 2024年 | 1~3 | NA | 2.1800000000000002 | 247610 | 2.44 | 448900 | 367555 | 273102 | 2.89 | 296016 | 3.24 | 524204 | 431111 | 324913 | 166773 | NA | 108.3 |
| NA | NA | NA | NA | 4~6 | NA | 2.17 | 243336 | 2.44 | 585981 | 477014 | 265894 | 2.88 | 294838 | 3.23 | 674715 | 547570 | 321269 | 158171 | NA | 109.4 |
| NA | NA | NA | NA | 7~9 | NA | 2.17 | 243416 | 2.4300000000000002 | 496157 | 409133 | 264339 | 2.88 | 292127 | 3.22 | 587586 | 484275 | 313249 | 163286 | NA | 110.4 |
| NA | NA | NA | NA | 10~12 | NA | 2.17 | 262019 | 2.4300000000000002 | 649532 | 538684 | 284317 | 2.88 | 317990 | 3.22 | 758114 | 627320 | 341116 | 170559 | NA | 111.9 |
| NA | NA | NA | 2025年 | 1~3 | NA | 2.16 | 257021 | 2.41 | 455099 | 374376 | 282334 | 2.88 | 311755 | 3.2 | 537071 | 440165 | 342759 | 168292 | NA | 113 |
| NA | NA | NA | NA | 4~6 | NA | 2.16 | 254707 | 2.4300000000000002 | 598201 | 474613 | 286204 | 2.87 | 312407 | 3.21 | 696038 | 551040 | 345950 | 161715 | NA | 113.7 |
| NA | NA | NA | NA | 7~9 | NA | 2.15 | 252063 | 2.41 | 511575 | 415555 | 284173 | 2.87 | 307629 | 3.2 | 606932 | 493401 | 341996 | 163303 | NA | 114.1 |
| NA | NA | NA | NA | 10~12 | NA | 2.15 | 267160 | 2.37 | 662555 | 549623 | 294387 | 2.87 | 324212 | 3.18 | 775565 | 645027 | 354484 | 176516 | NA | 115.3 |
| NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| NA | NA | NA | 2022年平均 | NA | NA | - | 3.9 | - | 2.4 | 2.1 | 3.6 | - | 4.2 | - | 2 | 1.7 | 3.6 | 4.3 | NA | 3 |
| NA | NA | NA | 2023 | NA | NA | - | 1.3 | - | -2.4 | -2.1 | -0.4 | - | 1.1000000000000001 | - | -1.5 | -1.2 | -0.6 | 3.6 | NA | 3.8 |
| NA | NA | NA | 2024 | NA | NA | - | 1.5 | - | 3.9 | 4.8 | 1.2 | - | 2.1 | - | 4.5999999999999996 | 5.6 | 2 | 1.1000000000000001 | NA | 3.2 |
| NA | NA | NA | 2025 | NA | NA | - | 3.6 | - | 3 | 1.9 | 5.7 | - | 4.5999999999999996 | - | 2.8 | 1.9 | 6.5 | 2.1 | NA | 3.7 |
| NA | NA | NA | 2021年度平均 | NA | NA | - | 2.2000000000000002 | - | -1.5 | -1.3 | 2.7 | - | 1.7 | - | 0.1 | -0.2 | 2.2000000000000002 | 5.3 | NA | 0.1 |
| 対前年(度・同期) 名目増減率 | NA | NA | 2022 | NA | NA | - | 4.5 | - | 3 | 2.4 | 3.4 | - | 4.5 | - | 1.9 | 1.3 | 3.7 | 6 | NA | 3.8 |
| NA | NA | NA | 2023 | NA | NA | - | -0.2 | - | -3 | -2.7 | -1.5 | - | 0.2 | - | -1.6 | -1.2 | -1.1000000000000001 | 0.3 | NA | 3.5 |
| NA | NA | NA | 2024 | NA | NA | - | 3.1 | - | 4.5 | 5.6 | 3 | - | 3.4 | - | 4.8 | 5.8 | 3.3 | 4 | NA | 3.5 |
| NA | NA | NA | 2021年 | 10~12 | 月期 | - | 0.5 | - | 0.4 | 1.6 | 0.6 | - | -0.1 | - | 3.3 | 4.0999999999999996 | 1 | 4.5999999999999996 | NA | 0.6 |
| NA | NA | NA | 2022年 | 1~3 | NA | - | 1.3 | - | 0.5 | 1.3 | 1.9 | - | 2.8 | - | 2.2999999999999998 | 3 | 2.2999999999999998 | -1.7 | NA | 1 |
| NA | NA | NA | NA | 4~6 | NA | - | 2.2000000000000002 | - | 0.8 | 0.4 | 1.2 | - | 3.2 | - | 0.5 | 0 | 2.4 | 0.9 | NA | 2.9 |
| NA | NA | NA | NA | 7~9 | NA | - | 5.9 | - | 1.8 | 1.9 | 6.8 | - | 7.1 | - | 0.9 | 0.6 | 6.9 | 3.8 | NA | 3.4 |
| NA | NA | NA | NA | 10~12 | NA | - | 3.8 | - | 7 | 5.8 | 3.6 | - | 4.0999999999999996 | - | 4.0999999999999996 | 3 | 3.1 | 4.7 | NA | 4.5999999999999996 |
| NA | NA | NA | 2023年 | 1~3 | NA | - | 4.5999999999999996 | - | 2.4 | 1.8 | 3.6 | - | 3.9 | - | 1.9 | 1.3 | 2.8 | 9 | NA | 4.3 |
| NA | NA | NA | NA | 4~6 | NA | - | -1 | - | -1 | -0.5 | -0.6 | - | -0.5 | - | -1.2 | -0.6 | -1.6 | -0.4 | NA | 3.9 |
| NA | NA | NA | NA | 7~9 | NA | - | 1.6 | - | -4 | -3.6 | -0.8 | - | 0.2 | - | -3 | -2 | -2.6 | 7.8 | NA | 3.7 |
| NA | NA | NA | NA | 10~12 | NA | - | 0.3 | - | -5 | -4.9000000000000004 | -2.2999999999999998 | - | 0.7 | - | -3 | -3 | -1 | 0.8 | NA | 3.4 |
| NA | NA | NA | 2024年 | 1~3 | NA | - | 0.8 | - | 0.6 | 0.3 | 0.5 | - | 0.2 | - | 1.3 | 1.4 | 0.5 | 4.7 | NA | 3 |
| NA | NA | NA | NA | 4~6 | NA | - | 2.1 | - | 5.2 | 7.5 | 0.3 | - | 2.2000000000000002 | - | 5.3 | 7.8 | 2 | 3.4 | NA | 3.1 |
| NA | NA | NA | NA | 7~9 | NA | - | 0.9 | - | 3.7 | 5 | -0.1 | - | 2.2000000000000002 | - | 5.6 | 6.7 | 1.1000000000000001 | -0.9 | NA | 3.2 |
| (%) | NA | NA | NA | 10~12 | NA | - | 2.2000000000000002 | - | 4.9000000000000004 | 5.7 | 3.1 | - | 3.9 | - | 5.6 | 6 | 4.3 | -0.8 | NA | 3.4 |
| NA | NA | NA | 2025年 | 1~3 | NA | - | 3.8 | - | 1.4 | 1.9 | 3.4 | - | 5.3 | - | 2.5 | 2.1 | 5.5 | 0.9 | NA | 4.4000000000000004 |
| NA | NA | NA | NA | 4~6 | NA | - | 4.7 | - | 2.1 | -0.5 | 7.6 | - | 6 | - | 3.2 | 0.6 | 7.7 | 2.2000000000000002 | NA | 4 |
| NA | NA | NA | NA | 7~9 | NA | - | 3.6 | - | 3.1 | 1.6 | 7.5 | - | 5.3 | - | 3.3 | 1.9 | 9.1999999999999993 | 0 | NA | 3.4 |
| NA | NA | NA | NA | 10~12 | NA | - | 2 | - | 2 | 2 | 3.5 | - | 2 | - | 2.2999999999999998 | 2.8 | 3.9 | 3.5 | NA | 3 |
| NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| NA | NA | NA | 2022年平均 | NA | NA | - | 0.9 | - | -0.6 | -0.9 | 0.6 | - | 1.2 | - | -1 | -1.3 | 0.6 | 1.3 | NA | - |
| NA | NA | NA | 2023 | NA | NA | - | -2.4 | - | -6 | -5.7 | -4 | - | -2.6 | - | -5.0999999999999996 | -4.8 | -4.2 | -0.2 | NA | - |
| NA | NA | NA | 2024 | NA | NA | - | -1.6 | - | 0.7 | 1.6 | -1.9 | - | -1.1000000000000001 | - | 1.4 | 2.2999999999999998 | -1.2 | -2 | NA | - |
| NA | NA | NA | 2025 | NA | NA | - | -0.1 | - | -0.7 | -1.7 | 1.9 | - | 0.9 | - | -0.9 | -1.7 | 2.7 | -1.5 | NA | - |
| NA | NA | NA | 2021年度平均 | NA | NA | - | 2.1 | - | -1.6 | -1.4 | 2.6 | - | 1.6 | - | 0 | -0.3 | 2.1 | 5.2 | NA | - |
| 対前年(度・同期) 実質増減率 | NA | NA | 2022 | NA | NA | - | 0.7 | - | -0.8 | -1.3 | -0.4 | - | 0.7 | - | -1.8 | -2.4 | -0.1 | 2.1 | NA | - |
| NA | NA | NA | 2023 | NA | NA | - | -3.6 | - | -6.3 | -6 | -4.8 | - | -3.2 | - | -4.9000000000000004 | -4.5 | -4.4000000000000004 | -3.1 | NA | - |
| NA | NA | NA | 2024 | NA | NA | - | -0.4 | - | 1 | 2 | -0.5 | - | -0.1 | - | 1.3 | 2.2000000000000002 | -0.2 | 0.5 | NA | - |
| NA | NA | NA | 2021年 | 10~12 | 月期 | - | -0.1 | - | -0.2 | 1 | 0 | - | -0.7 | - | 2.7 | 3.5 | 0.4 | 4 | NA | - |
| NA | NA | NA | 2022年 | 1~3 | NA | - | 0.3 | - | -0.5 | 0.3 | 0.9 | - | 1.8 | - | 1.3 | 2 | 1.3 | -2.7 | NA | - |
| NA | NA | NA | NA | 4~6 | NA | - | -0.7 | - | -2 | -2.4 | -1.7 | - | 0.3 | - | -2.2999999999999998 | -2.8 | -0.5 | -1.9 | NA | - |
| NA | NA | NA | NA | 7~9 | NA | - | 2.4 | - | -1.5 | -1.5 | 3.3 | - | 3.6 | - | -2.4 | -2.7 | 3.4 | 0.4 | NA | - |
| NA | NA | NA | NA | 10~12 | NA | - | -0.8 | - | 2.2999999999999998 | 1.1000000000000001 | -1 | - | -0.5 | - | -0.5 | -1.5 | -1.4 | 0.1 | NA | - |
| NA | NA | NA | 2023年 | 1~3 | NA | - | 0.3 | - | -1.8 | -2.4 | -0.7 | - | -0.4 | - | -2.2999999999999998 | -2.9 | -1.4 | 4.5 | NA | - |
| NA | NA | NA | NA | 4~6 | NA | - | -4.7 | - | -4.7 | -4.2 | -4.3 | - | -4.2 | - | -4.9000000000000004 | -4.3 | -5.3 | -4.0999999999999996 | NA | - |
| NA | NA | NA | NA | 7~9 | NA | - | -2 | - | -7.4 | -7 | -4.3 | - | -3.4 | - | -6.5 | -5.5 | -6.1 | 4 | NA | - |
| NA | NA | NA | NA | 10~12 | NA | - | -3 | - | -8.1 | -8 | -5.5 | - | -2.6 | - | -6.2 | -6.2 | -4.3 | -2.5 | NA | - |
| NA | NA | NA | 2024年 | 1~3 | NA | - | -2.1 | - | -2.2999999999999998 | -2.6 | -2.4 | - | -2.7 | - | -1.7 | -1.6 | -2.4 | 1.7 | NA | - |
| NA | NA | NA | NA | 4~6 | NA | - | -1 | - | 2 | 4.3 | -2.7 | - | -0.9 | - | 2.1 | 4.5999999999999996 | -1.1000000000000001 | 0.3 | NA | - |
| NA | NA | NA | NA | 7~9 | NA | - | -2.2000000000000002 | - | 0.5 | 1.7 | -3.2 | - | -1 | - | 2.2999999999999998 | 3.4 | -2 | -4 | NA | - |
| (%) | NA | NA | NA | 10~12 | NA | - | -1.2 | - | 1.5 | 2.2000000000000002 | -0.3 | - | 0.5 | - | 2.1 | 2.5 | 0.9 | -4.0999999999999996 | NA | - |
| NA | NA | NA | 2025年 | 1~3 | NA | - | -0.6 | - | -2.9 | -2.4 | -1 | - | 0.9 | - | -1.8 | -2.2000000000000002 | 1.1000000000000001 | -3.4 | NA | - |
| NA | NA | NA | NA | 4~6 | NA | - | 0.7 | - | -1.8 | -4.3 | 3.5 | - | 1.9 | - | -0.8 | -3.3 | 3.6 | -1.7 | NA | - |
| NA | NA | NA | NA | 7~9 | NA | - | 0.2 | - | -0.3 | -1.7 | 4 | - | 1.8 | - | -0.1 | -1.5 | 5.6 | -3.3 | NA | - |
| NA | NA | NA | NA | 10~12 | NA | - | -1 | - | -1 | -1 | 0.5 | - | -1 | - | -0.7 | -0.2 | 0.9 | 0.5 | NA | - |
| NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| 注1 総世帯には、「勤労者世帯」、「無職世帯」のほか、世帯主が個人経営者、法人経営者、自由業者などの世帯が含まれる。 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| 2 総世帯及び単身世帯の四半期結果と年(度)平均では結果の推定方法が異なるので、年(度)の平均は当該4四半期分の単純平均とはならない。 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| 3 消費者物価指数(持家の帰属家賃を除く総合)は、2020年基準(2020年=100)である。 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| 4 「実収入」及び「可処分所得」の実質化には消費者物価指数(持家の帰属家賃を除く総合)を用いた。 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
| species | island | bill_len | bill_dep | flipper_len | body_mass | sex | year |
|---|---|---|---|---|---|---|---|
| Adelie | Torgersen | 39.1 | 18.7 | 181 | 3750 | male | 2007 |
| Adelie | Torgersen | 39.5 | 17.4 | 186 | 3800 | female | 2007 |
| Adelie | Torgersen | 40.3 | 18.0 | 195 | 3250 | female | 2007 |
| species | island | bill_len | bill_dep | flipper_len | body_mass | sex | year |
|---|---|---|---|---|---|---|---|
| Adelie | Torgersen | 39.1 | 18.7 | 181 | 3750 | male | 2007 |
| Adelie | Torgersen | 39.5 | 17.4 | 186 | 3800 | female | 2007 |
| Adelie | Torgersen | 40.3 | 18.0 | 195 | 3250 | female | 2007 |
| Adelie | Torgersen | NA | NA | NA | NA | NA | 2007 |
| Adelie | Torgersen | 36.7 | 19.3 | 193 | 3450 | female | 2007 |
Rはデータを読み込む際に列の値を見て、自動で型を推定します。ただしカテゴリの順序は自動では付きません。例:「male / female」や評価「S / A / B / C / F」も単なるカテゴリとして扱われます(デフォルトでは、アルファベット順に並びます)。順序付きカテゴリ(ordered factor)にしたい場合は自分で指定する必要があります(後日説明)
Rows: 344
Columns: 8
$ species <fct> Adelie, Adelie, Adelie, Adelie, Adelie, Adelie, Adelie, Ad…
$ island <fct> Torgersen, Torgersen, Torgersen, Torgersen, Torgersen, Tor…
$ bill_len <dbl> 39.1, 39.5, 40.3, NA, 36.7, 39.3, 38.9, 39.2, 34.1, 42.0, …
$ bill_dep <dbl> 18.7, 17.4, 18.0, NA, 19.3, 20.6, 17.8, 19.6, 18.1, 20.2, …
$ flipper_len <int> 181, 186, 195, NA, 193, 190, 181, 195, 193, 190, 186, 180,…
$ body_mass <int> 3750, 3800, 3250, NA, 3450, 3650, 3625, 4675, 3475, 4250, …
$ sex <fct> male, female, female, NA, female, male, female, male, NA, …
$ year <int> 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007…
| skim_type | skim_variable | n_missing | complete_rate | factor.ordered | factor.n_unique | factor.top_counts | numeric.mean | numeric.sd | numeric.p0 | numeric.p25 | numeric.p50 | numeric.p75 | numeric.p100 | numeric.hist |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| factor | species | 0 | 1 | FALSE | 3 | Ade: 152, Gen: 124, Chi: 68 | NA | NA | NA | NA | NA | NA | NA | NA |
| factor | island | 0 | 1 | FALSE | 3 | Bis: 168, Dre: 124, Tor: 52 | NA | NA | NA | NA | NA | NA | NA | NA |
パッケージのインストール、読み込み方法を忘れた人は、前回の教材を参照しましょう
Cf. base R関数場合
species island bill_len bill_dep
Adelie :152 Biscoe :168 Min. :32.10 Min. :13.10
Chinstrap: 68 Dream :124 1st Qu.:39.23 1st Qu.:15.60
Gentoo :124 Torgersen: 52 Median :44.45 Median :17.30
Mean :43.92 Mean :17.15
3rd Qu.:48.50 3rd Qu.:18.70
Max. :59.60 Max. :21.50
NA's :2 NA's :2
flipper_len body_mass sex year
Min. :172.0 Min. :2700 female:165 Min. :2007
1st Qu.:190.0 1st Qu.:3550 male :168 1st Qu.:2007
Median :197.0 Median :4050 NA's : 11 Median :2008
Mean :200.9 Mean :4202 Mean :2008
3rd Qu.:213.0 3rd Qu.:4750 3rd Qu.:2009
Max. :231.0 Max. :6300 Max. :2009
NA's :2 NA's :2
'data.frame': 344 obs. of 8 variables:
$ species : Factor w/ 3 levels "Adelie","Chinstrap",..: 1 1 1 1 1 1 1 1 1 1 ...
$ island : Factor w/ 3 levels "Biscoe","Dream",..: 3 3 3 3 3 3 3 3 3 3 ...
$ bill_len : num 39.1 39.5 40.3 NA 36.7 39.3 38.9 39.2 34.1 42 ...
$ bill_dep : num 18.7 17.4 18 NA 19.3 20.6 17.8 19.6 18.1 20.2 ...
$ flipper_len: int 181 186 195 NA 193 190 181 195 193 190 ...
$ body_mass : int 3750 3800 3250 NA 3450 3650 3625 4675 3475 4250 ...
$ sex : Factor w/ 2 levels "female","male": 2 1 1 NA 1 2 1 2 NA NA ...
$ year : int 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 ...
イコール記号は二つ連続して下さい(==)。文字(文字ベクトル)は “” で囲んで下さい
03:00
03:00
05:00
is.na()(値がNAかどうかをTRUE/FALSEで判定する)して除外NAをすべて削除すればよいとは限りません。他の項目に使える情報が残っていることもあります。大切なのは「今回の分析でその値が必要かどうか」を考えることです。また、NAの扱いは研究領域やデータの性質に依存するため、一概にどの方法がよいとは言えない点にも注意しましょう
drop_na()と書く(引数を指定しない)と、すべての列を対象に、NAが含まれている行が除外されます
| skim_type | skim_variable | n_missing | complete_rate | factor.ordered | factor.n_unique | factor.top_counts | numeric.mean | numeric.sd | numeric.p0 | numeric.p25 | numeric.p50 | numeric.p75 | numeric.p100 | numeric.hist |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| numeric | body_mass | 0 | 1 | NA | NA | NA | 4201.754 | 801.9545 | 2700 | 3550 | 4050 | 4750 | 6300 | ▃▇▆▃▂ |
| skim_type | skim_variable | n_missing | complete_rate | factor.ordered | factor.n_unique | factor.top_counts | numeric.mean | numeric.sd | numeric.p0 | numeric.p25 | numeric.p50 | numeric.p75 | numeric.p100 | numeric.hist |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| numeric | body_mass | 0 | 1 | NA | NA | NA | 4207.057 | 805.2158 | 2700 | 3550 | 4050 | 4775 | 6300 | ▃▇▅▃▂ |
「!否定(〜ではない)」という書き方もできますが(filter(!is.na(body_mass)))、dplyr 1.2.0(2026年2月)で、filter_out()関数が追加されたことにより非推奨となっています(blog)
mutate(across(everything(), ~replace_na(.x, 0))) ですべての行のnaを0に置き換えられます
03:00
第7回の授業で簡単に説明します。今回は同一処理をこのように単純化できて便利!という点だけ理解しましょう
vars <- c("body_mass", "bill_len", "flipper_len") # 変数を指定
map(vars, \(v) { #map()関数を使って同一処理を指示
penguins |> # タイトルを除くコードは先と同じ
drop_na(body_mass) |>
group_by(species, sex) |>
summarise(avg = mean(.data[[v]])) |>
ggplot(aes(x = species, y = avg)) +
geom_col() +
facet_wrap(~ sex) +
labs(title = paste("Average of", v)) # varsからタイトルを付与
})[[1]]

[[2]]

[[3]]

graph BT
A(["<strong>base R</strong>
Rの基本構文・関数
例: mean(), sum(), if"]) -->
B(["<strong>modern R</strong>
便利な文法・スタイル
例: |> パイプ, tibble, dplyr 文法,<br> ggplot2 文法"]) -->
C(["<strong>Packages</strong>
Rに追加するツール集
例: tidyverse, ggplot2,<br>readr, shiny"])
%% ノードのスタイル
style A text-align:center
style B text-align:center
style A text-align:center, fill:#FFD700,stroke:#333,stroke-width:1px,font-weight:bold;
style B text-align:center, fill:#87CEFA,stroke:#333,stroke-width:1px,font-weight:bold;
style C text-align:center, fill:#90EE90,stroke:#333,stroke-width:1px,font-weight:bold;
flowchart TB
Start([YAML設定(ドキュメントの設定):<br> タイトル、出力形式、テーマなど]) --> B[データの読み込み・前処理:<br> dplyr / tidyr
<br>(フィルタリング / 新列作成・計算<br>/ 縦持ち・横持ち変換 / 欠損値処理)]
B --> C1[データの概要と可視化:<br> skim, gt_summary / ggplot2]
B --> C2[統計分析・モデル構築:<br> lm, glm, 因果推論]
C1 --> D[結果の評価・解釈:<br> broom, modelsummary, performance]
C2 --> D
D --> End([レポート作成(レンダー):<br> knitr / rmarkdown<br>(pdf; reveal.js; webpage; docx; pptx; pdf)])
%% 色付け
style Start fill:#a2d4f1,stroke:#333,stroke-width:2px
style End fill:#f1d4a2,stroke:#333,stroke-width:2px
style C1 fill:#d4f1a2,stroke:#333,stroke-width:1px
style C2 fill:#f1a2d4,stroke:#333,stroke-width:1px
最近、環境科学者と協力して、大きなRパッケージのリファクタリングを行っています。彼女をジェーンと呼びましょう。
ジェーンはコードの混乱を継承し、できるだけ早くそれを動作させなければなりませんでした。彼女は時間の中でできる限りそれを最良にしましたが、会社がそれに依存している今、注意が必要です。私たちはそれを彼女の「Russian Doll code」と呼びました。なぜなら、それは多数の入れ子関数を持ち、各関数が同じ巨大な入れ子リストを行き来しているからです(Refactoring Russian Doll Code) 。
