St_Hakky’s blog

Data Science / Human Resources / Web Applicationについて書きます

Julia入門 - Strings

こんにちは。今日は、JuliaのString型について書きます。勉強していく中で、Pythonとは少し違う部分があるんだなぁと思ったので、そのあたりを中心にまとめます*1。 String型 以下のJupyter Notebookにやったこととか書き方とかまとめてます。 gist.github.c…

Julia入門 - Hello World / コメント / 基本的な算術演算

こんにちは。Julia入門をしています。今日はお決まりの、Hello Worldあたりを攻めていこうと思います*1。 環境構築 以下でやりました。st-hakky.hatenablog.com Hello World 以下のような感じですね。 gist.github.com少しだけコードの補足を以下に書きます…

【Python】functools.partial()で関数やメソッドの引数の一部を固定する部分適用を行う

こんにちは。最近、化粧のやり方とかを紹介するYoutuberを見て、「へぇー綺麗にできるもんだなぁ」って感心している私ですが、今日はfunctools.partial()の綺麗な使い方を見つけたので、その紹介をメモがてらしようと思います。 関数やメソッドの引数の一部…

Julia入門 - 入門者がまず読むべき参考サイトや本のまとめ【随時更新】

こんにちは。Pythonはある程度かけるが、Juliaに関しては全くの初心者である私がこれからJuliaでデータサイエンスをしたり、Deep Learningをしたりしようと思っているので、その学んだ過程とかで参考になった資料とかをまとめておこうかと思います*1。Julia…

論文を読んでブログにまとめていこうと思うので、そのまとめ方をまとめておく

こんにちは。今日はタイトルの件について書きます*1。 モチベーション これまでは、メモ程度でまとめていたり、発表資料(PPT)とかブログでガッツリまとめて公開したり、さらっとメモをブログの下書き機能で書いたりみたいな感じで*2、全然統一感なくまとめて…

【Python】ピアソンの相関係数をいろいろな方法で計算する方法まとめ(SciPy / Numpy / Pandas)

こんにちは。今日は題名の通り。色んな所で目にするピアソンの相関係数ですが、毎回実装の方法調べちゃうので、ピアソンの相関係数をいろんな方法で計算する方法をまとめておきたいと思います。 Pearsonの(積率)相関係数とは ピアソンの相関係数は、英語では…

【Python】実行時間を測定する方法まとめ

こんにちは。実行時間(処理時間)を計測したいことはよくあると思いますが、今回はPythonで実行時間を測りたいなってなった時の方法を、自分用にまとめておきたいと思います。※なんか章立ての粒度がばらばらになってしまった気がするが、細かいことは気にしな…

【Python】可視化ライブラリであるBokehのインストール

こんにちは。最近、Bokehを使っているんですが、そのインストールについて備忘録かねてメモしておきます。 環境 今回試している環境は、以下の通りです。 $ cat /etc/redhat-release CentOS Linux release 7.3.1611 (Core) Anacondaのインストール この手の…

自然言語処理する時に計算するJaccard係数をPythonで計算する方法まとめ

こんにちは。Jaccard係数についてPythonで実装する時にありそうなパターンをまとめてみました。また、自然言語処理の分野からJaccard係数についても調べました。 Jaccard係数 まず、Jaccard係数について説明して、その後実装の部分に入っていきます。 読み方…

2017年の振り返り

こんにちは。今年は何をやったか思い出せないくらいにはなんかやってた気がします笑。去年もやりましたが、今年も一年の振り返りをしておこうかなぁと思います。st-hakky.hatenablog.comあと、これも去年書いてますが、最近色んな人が私のブログを見てくれて…

データ分析とか学習回したりするときのPythonのログ出力について

こんにちは。もう少し勉強していきたいなと思うものの、こればっかり一生懸命になっているとあんまりコードを書く手が進まなくなるので、ぼちぼち勉強して行こうと思っているのが、ログ出力(笑)分析とかしていると、途中で学習が止まっていたり、思っていた…

【Python】数量データの正規化 ( 標準化 ) について

こんにちは。今回はデータの正規化についてです。いろんな文脈で様々な意味で使われている「正規化」っていう言葉ですが、今回は統計や機械学習で扱う数量のデータに対して行うことに絞り、まとめていきたいと思います。 Introduction データの正規化とは こ…

BitbucketでJupyter Notebookがレンダリングされるようになったらしいので、やってみた

こんにちは。今一緒にKaggleをやっているメンバーから、slackでレンダリングのサポートがされていることを聞いたので、やってみました(10/25には既に公開されていたのに知らなかったという笑)。 ◯Githubでは既にあるのに今までなかった… Bitbucketって便利な…

Centos7にRとRstudio serverをインストール

こんにちは。Rを使うので、インストールします。これは作業ログ。 〇環境 $ cat /etc/redhat-release CentOS Linux release 7.3.1611 (Core) 〇Rのinstall Centos 7でインストールをしていきます。 ■EPELのインストール yumでインストールするために、EPELを…

HugoをCentos7にインストールしたのでその作業メモ

こんにちは。Hugoを導入したので、その作業メモを残します。 〇Hugoとは 静的なHTMLを作成することができるGo言語製の静的ページジェネレーターです。 Web : Hugo | A Fast and Flexible Website Generator Github : GitHub - gohugoio/hugo: A Fast and Fle…