I hosted a Youtube channel to teach deep learning with FastAI and PyTorch in Japanese. I think it’s a good time to share my experience because this is close to the end of this year anyway.

To tell the truth, I have started teaching deep learning for programmers who don’t have CS background 2 years ago. But at that time there was no covid and I didn’t broadcast my lecture to public. It was a classic class room style lecture.

This year I thought it was a good idea to teach deep learning for any programmers who want to learn…

FastAIのバージョン2がリリースされましたので、それに合わせて「日本語でやる、プログラマ向けディープラーニング講座」をバージョンアップさせたいと思います。

基本的にはバージョン1向けの講座と同内容ですが、チュートリアルはfastaiライブラリのバージョン2を使います。

コンテンツはバージョン1同様、Youtubeへアップロード予定ですが、今回は講義はリアルタイムで配信予定です。

もし、リアルタイムにご覧になりたい方、あるいは現地で講義に参加されたい方は下記よりお問い合わせ頂けますでしょうか。

講義について

講義はプログラマ向けにディープラーニングを教えている非営利団体、FastAIの創業者Jeremy Howardがサンフランシスコ大学で行った講義を講師が咀嚼した上で日本語で行うものです。

使用するフレームワークに関して

本講義では非営利団体FastAIが提供するfastaiというライブラリを使用します。fastaiはPyTorchの上で動作するハイレベルのフレームワークで、比較的簡単にディープラーニングの学習、及び推論を体験することができます。

TensorflowにおけるKerasのようなものですが、Kerasを学んでもピュアなTensorflowが扱えるようになるのは困難ですが、fastaiなら、fastaiで学んだ後にナチュラルにPyTorchを使いこなせるようになることが可能です。もちろん、それなりの努力は必要ですが。

いずれにせよ、ディープラーニングはアカデミックな世界を離れ、ビジネスの現場で使われるようになってきています。それにともなって数学よりもコーディングが得意な人材が必要になってきています。

是非、一緒にディープラーニングを学び、所謂ソフトウェアだけでは実現できない、ディープラーニングが使えてこそ開発できる新しいアプリケーションを開発していきましょう。

ところで、リアルタイムの講義は株式会社ギークフィードのオフィスにて行わせていただく予定です。以下に場所とスケジュールを記載します。

会場: 株式会社ギークフィード
東京都台東区小島2–20–7 扶桑御徒町ビル5F

日時: 2020年9月24日開始
毎週木曜日、午後4時より1時間半〜2時間程度を予定。
進捗にもよりますが、全12〜14回程度を予定。

Requirements: 数年程度のプログラミング経験とやる気。

費用: 無料

現地参加は会場の広さの関係もあってお問い合わせ頂いた全ての方にご参加いただけるわけではありませんが、ご興味のある方は是非お問い合わせ頂けますでしょうか。

Private conversation is everywhere. If you talk to your wife, it’s obviously a private conversation. If you talk to an operator of a contact center, it’s still considered private. Almost all conversations are considered as private. Public debate is one of the exceptions.

If you want to extract meaning out of private conversation, you need to access private data, which you can not access in most cases. That’s why I think a privacy preserving deep learning technique is the key to taking speech-to-text AI to the next phase.

In this tutorial, I will show how to train a speech command…

This article is a part 2 of dissecting deepspeech.pytorch, which is one of implementations of Baidu’s DeepSpeech2 paper. I think deepspeech.pytorch is clean and relatively simple and very educative.

I explained overall concept and data processing in part 1. I’m going to explain the model architecture at part 2.

Architecture

Architecture is some 2D Convolutions, RNN layers, and Fully Connected layer.

deepspeech.pytorch is one of implementations of Baidu’s DeepSpeech2 paper. I think deepspeech.pytorch is clean and relatively simple and very educative.

I’m thinking about dissecting deepspeech.pytorch in 2 articles, part 1 for overall concept and data processing, part 2 for model. Part 2 is here.

What is DeepSpeech2

DeepSpeech2 is one of idea/architecture for speech-to-text model. In a nutshell, you can train your own speech-to-text model with DeepSpeech2. BTW, DeepSpeech2 has two siblings, DeepSpeech and DeepSpeech3.

What was special about DeepSpeech?

DeepSpeech was one of pioneer models of deep learning based end-to-end speech-to-text model. Since the paper was published on Dec 2015, there are…

昨年からやらせて頂いていたプログラマ向けディープラーニング講座ですが、今回コロナウィルス感染症の影響もあり、Youtubeで公開させて頂くことに致しました。

英語で学ぶのであれば、無料もしくは安価にプログラマがディープラーニングを学べるサービス/プラットフォームがいくつもありますが、日本語で学ぶということになると限られた数しか存在しません。

そこで、日本語で数学が必ずしも得意ではないプログラマ向けにディープラーニングを学べるコンテンツを作成/アップロードしていくことに致しました。

講座の内容はFastAIというプログラマ向けにディープラーニングを教えている非営利団体のコンテンツ(英語)を僕なりに咀嚼し、日本語で解説するものです。元々予定していたオフラインでの講習会の内容をオンライン化したものでもあります。

FastAIはJeremy Howardという大変ユニークで魅力的な人物が創業した非営利団体で、僕が目を通した、オンラインの学習コンテンツの中ではベストだと思えるものです。

その真骨頂はプログラミングがわかっていれば、数学がわからなくても大丈夫というものです。

例えは下記は平均を意味する数式です。

数学にアレルギーがある方は思わず目を背けちゃいますよね。

ですが、プログラムだとたったの一行です。

OpenMinedの中でCOVID-19関連アプリの開発を支援しようという動きがあり、そのお知らせ記事の翻訳を行わせて頂きました。

翻訳記事はこちらです。

詳細は記事を読んで頂ければお分かり頂けると思うのですが、背景を補足しておいた方がわかりやすいと思い、ここに記します。

OpenMinedとは

OpenMinedはプライバシーに配慮したディープラーニングの手法を開発、オープンソースで公開しているプロジェクトです。

COVID-19アプリとは

現在コロナウィルスの感染拡大を受けて、感染の広がりを分析するためアプリケーションが急ピッチで開発されています。

ざっくりいうと、感染者のスマートフォンに特定のアプリを入れさせ、感染者がどこで誰にあったのか、どんなイベントに参加したのかをトラッキングするアプリです。

クラスタの発見に役立ちますし、年齢その他の情報とともにその後の症状の経過もデータ化できれば、コロナウィルスそのものに対する分析に役立ちます。

しかしながら、位置情報、コンタクト、そして所属しているグループ(学校、会社、サークルなど)の情報をガバメントに全て渡してしまうというのはある意味において危険な事です。

政府が人を管理するツールとして将来使われないとも限らないですし、突貫工事で開発されたアプリはセキュリティ的に脆弱である可能性も高いです。

OpenMinedが活用できるところ

そこで、OpenMinedです。OpenMinedは元々はプライバシーを侵害せずディープラーニングのトレーニングを行える技術をオープンソースのライブラリとして提供しているのですが、同じ技術がプライバシーは守りつつも統計情報は活用できる、そんなアプリ開発に使える可能性があります。

コロナウィルス関連で個人をトラッキングするアプリを開発中だけど、興味があるという方は是非OpenMinedの詳細を見てみてください。

昨年から行なっているプログラマ向けディープラーニング講習会を今年も実施しようと思っています。

[UPDATED] 2020/04/01現在、新型コロナウィルスの蔓延を受けて、講習会は延期させて頂く事になりました。

内容は前回同様FastAIのチュートリアルとマテリアルをそのまま使います。英語がわかる方は本家の講義映像がYoutubeに上がっておりますので、そちらをご覧頂くことをおすすめです。この講習会は、Jeremy Howardが行なっているプログラマ向けディープラーニング講習会(英語)を講師が咀嚼し、変更を加えた上で、日本語で解説するものです。

日時

原則毎週火曜日、午後7時〜9時。スタートは4/14(火)で、最終日は7/7(火)を予定しています。
* 5/5は祝日のためお休みです
* 7/7は七夕なので、スライドになる可能性があります
* 全13回を予定しています

場所

〒141–0031 東京都品川区西五反田7丁目21−11 第2TOCビル(予定)
JR五反田駅から徒歩10分です。

コンテンツ

FastAIのチュートリアルを用いて、ディープラーニングのフレームワークの一つであるPytorch、及びPytorchを簡単に使えるライブラリであるfastai(非営利大体のFastAIはfastaiという名前もライブラリも作っています)について学び、実践的なアプリケーションが作れるようになることを目指します。

基本的な構造はFastAIのチュートリアルに従いつつ、いくつか独断と偏見で不要と判断した部分を割愛し、(FastAIを使わない)純粋なPytorchの使い方を追加しています。

4/14: Image Classification

4/21: SGD

4/28: Multi-Label Classification, Image Segmentation

5/12: Regression in Image, Sentence Classification

5/19: Sentence Classification, Tabular

5/26: Tabular, Collaborative Filtering

6/2: Foundation of Neural Network

6/9: Regularization, CNN

6/16: Python in Deep Learning

6/23: Training Loop in Pure Pytorch

6/30: ResNet, GANS

7/7: Super resolution, RNN

費用

無料ですが、ノートパソコンをお持ち頂く必要があります。

前提条件

使用言語はPython、使用フレームワークはPytorchです。算数がわからなくても、PythonもPytorchも使えなくても結構ですが、(病欠以外)全日程参加しようと思うやる気と3年程度のプログラミング経験がある事が望ましいです。

その他

FastAIはコンピュータサイエンスを大学で学んでいないプログラマ向けにディープラーニングを教えようという非営利団体です。創業者のJeremy HowardはKuggleの創業者でとてもユニークで魅力的な人物です。

ライブラリとしてのfastaiの2020年3月現在のバージョンは1ですが、今年の6月に2に上がる事が予定されています。そのため、長くfastaiを使おうと思うとどこかでバージョン2にキャッチアップする必要があります。

講師は喋ラボ代表の大橋です。

人数は最大で6名程度を考えています。

場所の日程は変更の可能性があります。

講師の意見としては、fastaiはよく出来たライブラリではありますが、実際の仕事では純粋なpytorchだけを使うことも多いため、ディープラーニングとは?どんなことが出来るのか?っていうことを掴む役に立つのであれば、fastaiのバージョンは1でも2でもどちらでも良いと思っています。

また、講義はYoutubeなどで公開される予定です。

講師から一言

ディープラーニングは理論から実践の時代に入り、より多くのプラクティショナーが必要になってきています。必要なのは自分でコードを書いたり他人のコードをハックできる能力です。気負わず、ディープラーニングを一緒に学んでいきましょう。

ご興味のある方は、数を把握する必要がございますので、こちらからお問い合わせ頂けますでしょうか。

It has been a bit long time since I reported Sotuu’s status last time. So here is our latest status.

Achievement

Our datasets have grown to 124,602 recordings as of September 29th, which was 150 hours 2minutes and 3 seconds worth data. Thanks everybody!

We have come to 30 % of our milestone, which is 500 hours of data.
We set our milestone to 500 hours of data because a developer on Mozilla Deepspeech’s forum told me 500 hours is enough to train a good enough model. Good enough depends on use cases of course.

fast.ai

BTW, I came across a really…

AI is eating the world. Everybody know it.

I know companies use crowdsourcing platform to purchase annotated data or letting crowd workers to label datasets. To tell the truth, we ourselves use a kind of crowdsourcing platform to acquire datasets.

The process is simple.

Crowd worker create labels for dataset to earn small amount of money.
Let’s say if we were dealing with image recognition AI and the price of one set of data is 10 cents, a crowd worker can earn 10 cents for each labeling task.

A company, which want annotated dataset, pay money for crowdsourcing platform and…

Ko

I'm a serial entrepreneur. I enjoy AI, UI, and blockchain. I like history and reading too.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store