{
"cells": [
{
"cell_type": "markdown",
"metadata": {
"id": "view-in-github",
"colab_type": "text"
},
"source": [
""
]
},
{
"cell_type": "markdown",
"source": [
"\n",
"この.ipynbファイルは\"**佐久間まゆがデータ解析する本**(C100,森の兄貴たち)\"で扱ったRのソースコードを実際に体験してもらうものです。\n",
"本ソース本書でも解説したように、重回帰分析を使用し、説明変数のデータから目的変数(Target)の予測までを扱います。 \n",
"\n",
"\n",
"---\n",
"本書に従い、以下の流れでプログラムを用意しています。\n",
"\n",
"1. データの読み込み\n",
"2. 散布図によるデータの可視化\n",
"3. 最小二乗法の実施\n",
"4. 相関係数の計算\n",
"5. データの精査\n",
"6. 重回帰分析の実施\n",
"\n",
"各項目について解説と、ソースコードの記載された\"セル\"を用意しています。本書(佐久間まゆがデータ解析する本)と内容を照らし合わせながらお使いください"
],
"metadata": {
"id": "SBHj5t533iiv"
}
},
{
"cell_type": "markdown",
"source": [
"##データの読み込み(p.22~)\n",
"本書2.3.3ではデータの読み込みを行いました。\n",
"本書ではデータファイルのアップロードと読み込みを実施しましたが、\n",
"ここではgithubに作成したcsvファイルをurlを用いて参照します。 \n",
"以下のセルを実行することで、本プログラムで使用するデータを読み込みます。\n",
"\n",
"\n",
"---\n",
"\n",
" **セルの実行内容**\n",
"\n",
"* 変数dfに読み込んだデータの格納\n",
"* headを関数を利用してデータの確認\n",
"\n",
"\n",
"\n",
"\n"
],
"metadata": {
"id": "0pxrZXaH6v8n"
}
},
{
"cell_type": "code",
"source": [
"df=read.csv(\"https://mori-no-anikitachi.github.io/event_source/c100/C100_Psan_dataset.csv\")\n",
"head(df,n=5) #データの先頭から5行分のデータにアクセス"
],
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 255
},
"id": "VlhGi8TJ1dp8",
"outputId": "3d629aaf-e7a9-4265-d787-1cd945ab96cb"
},
"execution_count": 1,
"outputs": [
{
"output_type": "display_data",
"data": {
"text/html": [
"
X | 昼ごはんカロリー | 歩数 | 前日夜ごはんカロリー | デスクワーク時間 | X346株価 | 移動距離.km. | 疲労度 | |
---|---|---|---|---|---|---|---|---|
<int> | <dbl> | <dbl> | <dbl> | <dbl> | <dbl> | <dbl> | <dbl> | |
1 | 1 | 928.2648 | 7360.969 | 1605.633 | 6.2414546 | 2020.078 | 47.04817 | 0.6895409 |
2 | 2 | 1076.0785 | 8030.141 | 1932.073 | -4.8387119 | 1997.943 | 50.60654 | 1.1188544 |
3 | 3 | 1017.3056 | 2329.565 | 1780.962 | -2.6177736 | 1993.756 | 22.10126 | -1.7072597 |
4 | 4 | 948.9185 | 4029.149 | 1476.462 | -0.5235055 | 1991.307 | 29.24467 | -1.2055580 |
5 | 5 | 955.2149 | 4462.707 | 1369.655 | 3.5888930 | 1997.010 | 31.81329 | -0.8175041 |