都内で働くデータサイエンティスト見習いの記録

都内某企業で働くデータサイエンティスト見習いのブログです。毎週土曜か日曜に更新予定

アウトプットのためブログを始めてみた

はじめまして。junno00です。

 

都内の会社で今年から新卒でデータサイエンティスト見習いとして働いています。

 

学部から大学院までの7年間はずっと生物系のラボにいて、既知の色々な生物のゲノムやタンパク質の情報のデータマイニングをしたり、分子生物学の実験をやっていました。 

 

大学院を卒業した時点でのITに関するスキルは以下のとおり

 

使ったことのあるプログラミング言語

  1. Perl
  2. R

 

内容については

  1. Perlについていえば、生ファイルから目的のデータをパースするためならどんなに汚いコードでもとりあえず動けばOK!
  2. 計算処理についてもアルゴリズムとかどうでもいい!どんなにメモリ喰ってもとりあえず正解が出ればOK!
  3. オブジェクト指向?何それ美味しいの?
  4. Rについてはとりあえず調べながら目的の図を描画できればOK!それ以外は知らん

 

統計学/機械学習に関しては研究に必要なところだけほんの少しかじり読みと実装

 

とまあ上記のようにITスキルも統計学の知識についてもズブの素人以上経験者未満みたいな感じだけれどもなぜか色々なご縁もあってIT/データサイエンス業界に入ったという感じです。

 

このブログではズブの素人以上経験者未満の新米データサイエンティストが「データサイエンス」に関わるスキルのアウトプットを記す場所として考えています。

 

具体的にはこんな感じのことを書こうかなと。

  • 統計学の本を読んだ後のまとめ
  • PythonやRで写経してまとめてみた
  • なんか分析テーマを決めてPython or Rで実装して分析してみた

 

これを読んでる人は

 

こいつヘタクソな実装してんな〜しょうがねぇ教えてやるか

 

と言ってコメントでしてくれるもよし (というか助けてくださいお願いします)、

 

「うわ、この人間違った統計の理解してるよ...直してやらないとこの業界の害悪になる」

 

と言ってコメントで叩いてくれるもよし (叩かないで優しく教えてくださいお願いします) 、

 

あるいは同じデータサイエンティスト見習いの人は

 

「junno00さんのブログを読んで業界で生きていける勇気が出ました!おかげで結婚できました!」

 

みたいな感じでコメントを残してくれるのでも何でもいいです。

 

そんなコメントを通してすこしでも自分のやってることをモノにできればなと思ってます。

 

 

 

上記が長ったらしいんで雑にまとめると 

みなさんが頑張るjunno00に手を差し伸べて立派なデータサイエンティスト育ててくださいお願いします

 

という感じです。

 

よろしくお願いします。