Material Book of Statistics

統計、機械学習、プログラミングなどで実験的な試みを書いていきます。

強化学習 n本腕バンディットにおけるε-グリーディ行動評価手法の性能比較を再現する

はじめに 会社の勉強会で強化学習を応用したマーケティング手法の発表を聞いて「強化学習が面白そうだ」と思い、私も勉強することにしました。 勉強している本は、Sutton and Barto著、三上・皆川訳の強化学習(原題: Reinforcement Learning: An Introduct…

Linuxカーネル4.15.0-48-genericでe1000eが認識できなくなる問題に対処した

要約 Linuxカーネルを4.15.0-48-genericにアップグレードしたらNICドライバe1000eを認識しなくなった 4.15.0-48-genericのままでe1000eをsudo make installで入れ直そうとするとgccがエラーを吐いて止まる カーネルを4.15.0-48-genericから4.15.0-47-generic…

GitのサーバーをEC2上に構築した

はじめに 私は個人でGitHubを利用しています。 非公開にして共有したいリポジトリがあるのですが、GitHubでは有償になってしまいます。 一方、GitLabでは無償枠でプライベートプロジェクトが持てますが、非公開にしたい プロジェクトの管理ツールは自分で制…

TensorFlow + Kerasの環境構築メモ

はじめに 2週間ほど前に機械学習やkaggleの勉強用に新しいPCを買いました。 このPCにTensorFlowとKerasをインストールした際の作業メモを残します。 インストール環境 インストールした環境は以下のとおりです。 pythonはすでにAnacondaでインストールしてあ…

Scrapyで欅坂46とけやき坂46の各メンバーの画像収集する

はじめに 欅坂46の画像で誰が写っているのかを認識させるアプリをディープラーニングで作ろうと思いますので、今回は各メンバーの画像を収集します。 MicrosoftのBing Image SearchやGoogleの画像検索APIを使うことも考えましたが、Yahoo、Bing、Googleでの…

ディープラーニングによるゆるキャラグランプリの順位予想

はじめに 私はゲーム会社でデータ分析を行っています。 アートの方々がアイテムの装着率を気にしているのを見る度に、「リリース前にクリエイティブを定量的に評価できる指標が無いだろうか?」と、考えていました。 ディープラーニングを勉強してみて「これ…

arXivのアップデート情報から自分の興味から最も遠い論文をあえてレコメンドしてみる

2018/06/23に@shunarooさんが主催している勉強会で話した内容を加筆・修正したものです。 興味から遠い論文を”あえて”レコメンドするSlack Botを作成してみる はじめに 皆さんはをどのように情報収集していますでしょうか? 私はfeedlyを試してみたものの、…

scikit-learn.feature_extraction.textのTfidfVectorizerを検証する

arXivのRSSで取得できる最新情報から自分に合うものをレコメンドしてくれるSlack Botを作っています。 まずはTF-IDFを使ってレコメンドを作る予定なので、scikit-learnのTfidfVectorizerを初めて触ってみました。 以下では、 http://scikit-learn.org/stable…

ブログを始めた経緯とブログタイトル

このブログ開設の経緯 Qiitaでいくつか投稿したのですが、今回新たにブログも始めました。 理由は次の2点です。 自分しか見ないメモのような投稿も気軽にしたいと思った。 プログラミングする前にあれこれ考えたアイディアもメモにして(可能な範囲で)公開…