Sign in

2021年8月、法人を立ち上げてから2年と4ヶ月、前身となるプロジェクトの準備から数えると3年の月日を経て、音声認識AIのクラウドサービスである喋ラボCLOUDをやっとの事でリリースすることができました。

ソツープロジェクト

実は喋ラボには前身となるプロジェクトがありました。AI、特にAI技術の開発に必要なデータが大企業に独占されつつあるという事に対する危機意識から生まれたプロジェクトで、参加者みんなで巨大なデータセット、商用利用に耐えうる音声認識エンジンを作れるデータセットを作ろうというプロジェクトでした。

ソツープロジェクトはみんなデータセットを作るというアイデアに加えてブロックチェーンのトークンをインセンティブとして使い、最終的にはトークンをキーとしたトークンエコノミーを作ることで持続的なプロジェクトとなるという目標を持っていました。

賛同してくれた友人とトークンエコノミーの設計に関してあーでもないこーでもないと議論を重ね、まずはデータを集めてみようということでiOSとAndroid向けにアプリを作り、音声を吹き込んでくれたり、吹き込まれた音声とテキストが合致しているかどうかチェックしてくれたらブロックチェーンのトークンを配るというやり方でスタートさせました。


久々の投稿になってしまいましたが、今日は日本におけるAI教育の難しさについてコメントを残したいと思います。AI技術といっても僕の場合はコンピュータサイエンスを大学で学んでいない人向けのディープラーニング教育のことです。

ご存知の方もいらっしゃるかもしれませんが、2年程前から友人の会社のプログラマさんを対象にスキルとしてのディープラーニングを教えたり、その講義内容をYoutubeで公開したりといったことをしてきました。

これは、英語で学ぶ事ができれば、質の良いコンテンツが無料、もしくは無料に近い価格で受けられます。USでも機械学習の無料講座といえば元々はのAndrew NgがやっていたCouseraの奴くらいしかなかったのですが、ニューラルネットの発展と知名度向上に伴ってUdacity、FastAI、Siraj ravalのYoutubeチャンネルなど、多くの優良講座が登場してきました。

以降、英語でディープラーニングを学べる講座に関しては、キャッチアップしていませんが、たしかCouseraもディープラーニングの講座を新設していたはずですし、その他数々のプレーヤーが参入して全体として質が上がってきていると思います。

余談ですが、Andrew Ngの初期のCouseraのコースはOctaveなるマニアックな言語を使い、行列計算をひたすら自分でやるような内容で、一応最後まで完走はしたものの、正直しんどいコースで、なおかつ、実際の役には何一つ役にも立たなかったのを覚えています。まぁパイオニアなので仕方がありませんよね。

一方で、日本語でディープラーニングを学ぶとなると、少なくとも2年前の時点では無料で受けられる質の高い講座がありませんでした。少なくとも僕は見つけられませんでした。東京大学が提供していた講座はまぁまぁだったかもしれませんが、フレームワークとしてChainerが使われており、Chainerそのものは優れたフレームワークですが、世界的には知名度が低く、お世辞にも初心者向けとは言えませんでした。

プログラムを書く仕事をされているかたであればご理解頂けると思いますが、困った時はStack overflowを見て、それっぽい解決策をコピペ&微調整で動くものを作って行きますよね。ユーザーが少ないということは困った時に全て自分で考えて解決策を見つけていかなければならないので、使い手に力量が求められます。

いずれにせよ、理論から実践へという段階において、FastAIのプログラマがディープラーニングを使えると便利なんだ。エンジニアのアイデアが入ると研究の方も進化するんだというメッセージは僕に強く響き、それを日本語で学べる講座をやってみようというのが出発点でした。

そんなこんなで、友人の会社でFastAIをベースとした講座をやったり、それを録画してYoutubeで垂れ流してみたりしたわけですが、思ったようなインパクトは作れませんでした。

ちょこっと見てくれた方はそれなりにいたと思うのですが、やり切って、なおかつ仕事や趣味で活用するに至った方はごく僅かです。ほとんど居ないといっても良いかもしれません。

千載一遇のチャンスなんだから頑張れよ

もちろん、僕の知名度が低く、そもそも見てくれた人が少ないというのが根本にはあると思いますが、動画講義を見ただけではスキルとしてのディープラーニングは身に付かないというのも真理かなと思います。

ディープラーニングをスキルとして身につけるためには以下の3つが重要です。

  • コンセプトを理解する
  • 自分で実際にやってみる
  • 自分の興味のある分野で実践

コンセプトを理解するためには動画をご覧になっていただけば良いと思うのですが、その動画は1本1時間半を超える動画が10本以上と結構なボリュームです。また、その後jupyter notebooksの形式で与えられる教材を自分で実行して体験をする必要があります。正直コンセプトを理解するためには自分でjupyter notebooksを実行した後で再度動画を見たりする必要があるでしょうから、それなりに時間とエネルギーを使う覚悟がないとできることではありません。

その上で、チュートリアルは所詮チュートリアルなので、最後は自分の興味のある分野で実験をして理解を深めつつ何ができれば自分のやりたいことができるのかを感覚として掴んでいく必要があります。やりたい事を定、githubのレポジトリからそれっぽいものを見つけ、それをカスタマイズしつつ自分のデータで学習を行なってみるとか、そういった事です。

僕の場合、自分のスタートアップの武器にしたいという思いがあったので、誰のサポートを必要とすることもなく、この工程をこなし、ある程度ディープラーニングできますよといえる状態になれた(論文は読むけど書く事はないのでまだ道半ばかな…)わけですが、客観的にみると結構ヘビーですよね。

また、ハイスキルの方は引く手数多でしょうけど、エントリーレベルのデータエンジニアは、仕事してどんな案件があり、どんな会社に就職できるのかという泥臭い部分が不明瞭というのも強いモチベーションが生まれにくい土壌になってしまっているかもしれません。

まぁ、所謂プログラマ/エンジニアとしてまずまずの給料をもらっていて満足できていれば、わざわざ膨大なエネルギーを投入して新しいスキルを身につけようとは思わないですよね。膨大なエネルギーを投入した結果、何がどうなるのかも不明瞭なわけですし。

一方で、AIエンジニアの不足は何年も叫ばれていることですし、僕自身の経験から、僕がハッカータイプだったからこそ思いつけたアイデアがいくつもあり、プログラム能力のある奴がスキルとしてのディープラーニングを身につけると面白い事ができるようになるというのは間違いのないことだと思います。

余談ですが、僕のスタートアップ、喋ラボは正にハッカー的なスキルとディープラーニングスキルの融合から生まれた会社です。

そこで、教育プラットフォームのハンターシティと組んでちょっと風変わりなAI技術講座を開催してみることにしました。というか現在やっておりまして、その状況報告ということになります。

講座の内容ですが、元々の動画に加えて付け足したものは以下の3点です。

  • 実践問題を新設
  • 技術サポート
  • 3ヶ月以内に卒業試験をクリアできなかったら30万円という設定

まず、チュートリアルをなぞるだけでは実践部分が弱いのはわかっていたので、問題形式の実践課題を新設しました。実践課題のいくつかは最終試験という名前にして、そこをパスできるかどうかでクリアという概念を作りました。

また、強い意思をもって学習に臨んでいただくため、クリアできなかったら30万円という罰金制度を採用しました。これにより、途中で挫けそうになっても30万円がかかっているから頑張ろうと思ってもう一粘りしてもらえると嬉しいなと思っています。

あとは、やり切れることが重要なのでコーチングもできたら良いなとは思ったのですが、コーチングはまだ機能はしていません。コーチングは機能していませんが、個別の技術サポートは行なっており、エラーが出て進めないなどの障害は乗り越えてもらえるようになっています。

2021年8月20日現在、学生さんから主婦の方まで、10名を超える方が参加され、日々僕の動画やチュートリアルと格闘をされています。

参加者の方のプログラマとしての経験レベルは残念ながら低めなので、そこがどう出るかはわかりませんが、30万円の罰金制度のかいあってか割と多くの人が一生懸命努力をされている気がします。

最終試験の期限は10月17日なので、まずは脱落者の方が出ないようサポートをするとともに、一人でも勤めている会社や自分のスタートアップでスキルとしてのディープラーニングを活用できる方が出てくると嬉しいなと思います。

ちょっとボランティアとしては重たい感じになりつつあるので、僕も時間のやりくりが必要ですが。


I hosted a Youtube channel to teach deep learning with FastAI and PyTorch in Japanese. I think it’s a good time to share my experience because this is close to the end of this year anyway.

To tell the truth, I have started teaching deep learning for programmers who don’t have CS background 2 years ago. But at that time there was no covid and I didn’t broadcast my lecture to public. It was a classic class room style lecture.

This year I thought it was a good idea to teach deep learning for any programmers who want to learn…


FastAIのバージョン2がリリースされましたので、それに合わせて「日本語でやる、プログラマ向けディープラーニング講座」をバージョンアップさせたいと思います。

基本的にはバージョン1向けの講座と同内容ですが、チュートリアルはfastaiライブラリのバージョン2を使います。

コンテンツはバージョン1同様、Youtubeへアップロード予定ですが、今回は講義はリアルタイムで配信予定です。

もし、リアルタイムにご覧になりたい方、あるいは現地で講義に参加されたい方は下記よりお問い合わせ頂けますでしょうか。

講義について

講義はプログラマ向けにディープラーニングを教えている非営利団体、FastAIの創業者Jeremy Howardがサンフランシスコ大学で行った講義を講師が咀嚼した上で日本語で行うものです。

使用するフレームワークに関して

本講義では非営利団体FastAIが提供するfastaiというライブラリを使用します。fastaiはPyTorchの上で動作するハイレベルのフレームワークで、比較的簡単にディープラーニングの学習、及び推論を体験することができます。

TensorflowにおけるKerasのようなものですが、Kerasを学んでもピュアなTensorflowが扱えるようになるのは困難ですが、fastaiなら、fastaiで学んだ後にナチュラルにPyTorchを使いこなせるようになることが可能です。もちろん、それなりの努力は必要ですが。

いずれにせよ、ディープラーニングはアカデミックな世界を離れ、ビジネスの現場で使われるようになってきています。それにともなって数学よりもコーディングが得意な人材が必要になってきています。

是非、一緒にディープラーニングを学び、所謂ソフトウェアだけでは実現できない、ディープラーニングが使えてこそ開発できる新しいアプリケーションを開発していきましょう。

ところで、リアルタイムの講義は株式会社ギークフィードのオフィスにて行わせていただく予定です。以下に場所とスケジュールを記載します。

会場: 株式会社ギークフィード
東京都台東区小島2–20–7 扶桑御徒町ビル5F

日時: 2020年9月24日開始
毎週木曜日、午後4時より1時間半〜2時間程度を予定。
進捗にもよりますが、全12〜14回程度を予定。

Requirements: 数年程度のプログラミング経験とやる気。

費用: 無料

現地参加は会場の広さの関係もあってお問い合わせ頂いた全ての方にご参加いただけるわけではありませんが、ご興味のある方は是非お問い合わせ頂けますでしょうか。


Private conversation is everywhere. If you talk to your wife, it’s obviously a private conversation. If you talk to an operator of a contact center, it’s still considered private. Almost all conversations are considered as private. Public debate is one of the exceptions.

If you want to extract meaning out of private conversation, you need to access private data, which you can not access in most cases. That’s why I think a privacy preserving deep learning technique is the key to taking speech-to-text AI to the next phase.

In this tutorial, I will show how to train a speech command…


This article is a part 2 of dissecting deepspeech.pytorch, which is one of implementations of Baidu’s DeepSpeech2 paper. I think deepspeech.pytorch is clean and relatively simple and very educative.

I explained overall concept and data processing in part 1. I’m going to explain the model architecture at part 2.

Architecture

Architecture is some 2D Convolutions, RNN layers, and Fully Connected layer.


deepspeech.pytorch is one of implementations of Baidu’s DeepSpeech2 paper. I think deepspeech.pytorch is clean and relatively simple and very educative.

I’m thinking about dissecting deepspeech.pytorch in 2 articles, part 1 for overall concept and data processing, part 2 for model. Part 2 is here.

What is DeepSpeech2

DeepSpeech2 is one of idea/architecture for speech-to-text model. In a nutshell, you can train your own speech-to-text model with DeepSpeech2. BTW, DeepSpeech2 has two siblings, DeepSpeech and DeepSpeech3.

What was special about DeepSpeech?

DeepSpeech was one of pioneer models of deep learning based end-to-end speech-to-text model. Since the paper was published on Dec 2015, there are…


昨年からやらせて頂いていたプログラマ向けディープラーニング講座ですが、今回コロナウィルス感染症の影響もあり、Youtubeで公開させて頂くことに致しました。

英語で学ぶのであれば、無料もしくは安価にプログラマがディープラーニングを学べるサービス/プラットフォームがいくつもありますが、日本語で学ぶということになると限られた数しか存在しません。

そこで、日本語で数学が必ずしも得意ではないプログラマ向けにディープラーニングを学べるコンテンツを作成/アップロードしていくことに致しました。

講座の内容はFastAIというプログラマ向けにディープラーニングを教えている非営利団体のコンテンツ(英語)を僕なりに咀嚼し、日本語で解説するものです。元々予定していたオフラインでの講習会の内容をオンライン化したものでもあります。

FastAIはJeremy Howardという大変ユニークで魅力的な人物が創業した非営利団体で、僕が目を通した、オンラインの学習コンテンツの中ではベストだと思えるものです。

その真骨頂はプログラミングがわかっていれば、数学がわからなくても大丈夫というものです。

例えは下記は平均を意味する数式です。

数学にアレルギーがある方は思わず目を背けちゃいますよね。

ですが、プログラムだとたったの一行です。


OpenMinedの中でCOVID-19関連アプリの開発を支援しようという動きがあり、そのお知らせ記事の翻訳を行わせて頂きました。

翻訳記事はこちらです。

詳細は記事を読んで頂ければお分かり頂けると思うのですが、背景を補足しておいた方がわかりやすいと思い、ここに記します。

OpenMinedとは

OpenMinedはプライバシーに配慮したディープラーニングの手法を開発、オープンソースで公開しているプロジェクトです。

COVID-19アプリとは

現在コロナウィルスの感染拡大を受けて、感染の広がりを分析するためアプリケーションが急ピッチで開発されています。

ざっくりいうと、感染者のスマートフォンに特定のアプリを入れさせ、感染者がどこで誰にあったのか、どんなイベントに参加したのかをトラッキングするアプリです。

クラスタの発見に役立ちますし、年齢その他の情報とともにその後の症状の経過もデータ化できれば、コロナウィルスそのものに対する分析に役立ちます。

しかしながら、位置情報、コンタクト、そして所属しているグループ(学校、会社、サークルなど)の情報をガバメントに全て渡してしまうというのはある意味において危険な事です。

政府が人を管理するツールとして将来使われないとも限らないですし、突貫工事で開発されたアプリはセキュリティ的に脆弱である可能性も高いです。

OpenMinedが活用できるところ

そこで、OpenMinedです。OpenMinedは元々はプライバシーを侵害せずディープラーニングのトレーニングを行える技術をオープンソースのライブラリとして提供しているのですが、同じ技術がプライバシーは守りつつも統計情報は活用できる、そんなアプリ開発に使える可能性があります。

コロナウィルス関連で個人をトラッキングするアプリを開発中だけど、興味があるという方は是非OpenMinedの詳細を見てみてください。


昨年から行なっているプログラマ向けディープラーニング講習会を今年も実施しようと思っています。

[UPDATED] 2020/04/01現在、新型コロナウィルスの蔓延を受けて、講習会は延期させて頂く事になりました。

内容は前回同様FastAIのチュートリアルとマテリアルをそのまま使います。英語がわかる方は本家の講義映像がYoutubeに上がっておりますので、そちらをご覧頂くことをおすすめです。この講習会は、Jeremy Howardが行なっているプログラマ向けディープラーニング講習会(英語)を講師が咀嚼し、変更を加えた上で、日本語で解説するものです。

日時

原則毎週火曜日、午後7時〜9時。スタートは4/14(火)で、最終日は7/7(火)を予定しています。
* 5/5は祝日のためお休みです
* 7/7は七夕なので、スライドになる可能性があります
* 全13回を予定しています

場所

〒141–0031 東京都品川区西五反田7丁目21−11 第2TOCビル(予定)
JR五反田駅から徒歩10分です。

コンテンツ

FastAIのチュートリアルを用いて、ディープラーニングのフレームワークの一つであるPytorch、及びPytorchを簡単に使えるライブラリであるfastai(非営利大体のFastAIはfastaiという名前もライブラリも作っています)について学び、実践的なアプリケーションが作れるようになることを目指します。

基本的な構造はFastAIのチュートリアルに従いつつ、いくつか独断と偏見で不要と判断した部分を割愛し、(FastAIを使わない)純粋なPytorchの使い方を追加しています。

4/14: Image Classification

4/21: SGD

4/28: Multi-Label Classification, Image Segmentation

5/12: Regression in Image, Sentence Classification

5/19: Sentence Classification, Tabular

5/26: Tabular, Collaborative Filtering

6/2: Foundation of Neural Network

6/9: Regularization, CNN

6/16: Python in Deep Learning

6/23: Training Loop in Pure Pytorch

6/30: ResNet, GANS

7/7: Super resolution, RNN

費用

無料ですが、ノートパソコンをお持ち頂く必要があります。

前提条件

使用言語はPython、使用フレームワークはPytorchです。算数がわからなくても、PythonもPytorchも使えなくても結構ですが、(病欠以外)全日程参加しようと思うやる気と3年程度のプログラミング経験がある事が望ましいです。

その他

FastAIはコンピュータサイエンスを大学で学んでいないプログラマ向けにディープラーニングを教えようという非営利団体です。創業者のJeremy HowardはKuggleの創業者でとてもユニークで魅力的な人物です。

ライブラリとしてのfastaiの2020年3月現在のバージョンは1ですが、今年の6月に2に上がる事が予定されています。そのため、長くfastaiを使おうと思うとどこかでバージョン2にキャッチアップする必要があります。

講師は喋ラボ代表の大橋です。

人数は最大で6名程度を考えています。

場所の日程は変更の可能性があります。

講師の意見としては、fastaiはよく出来たライブラリではありますが、実際の仕事では純粋なpytorchだけを使うことも多いため、ディープラーニングとは?どんなことが出来るのか?っていうことを掴む役に立つのであれば、fastaiのバージョンは1でも2でもどちらでも良いと思っています。

また、講義はYoutubeなどで公開される予定です。

講師から一言

ディープラーニングは理論から実践の時代に入り、より多くのプラクティショナーが必要になってきています。必要なのは自分でコードを書いたり他人のコードをハックできる能力です。気負わず、ディープラーニングを一緒に学んでいきましょう。

ご興味のある方は、数を把握する必要がございますので、こちらからお問い合わせ頂けますでしょうか。

Ko

I'm a serial entrepreneur. I enjoy AI, UI, and blockchain. I like history and reading too.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store