ニュース
メルカリに実装される「売ることを空気にするAI」
2019年4月1日 08:15
フリマアプリとして2013年にサービスを開始して以来、数十億という膨大な商品関連データが集まっているという「メルカリ」。その「きれいな」ビッグデータをディープラーニングで処理することで、ユーザーがより出品しやすく、売れやすくする仕組みを作り上げている。ユーザーが気付かないうちに触れているかもしれないメルカリのAIは、一体どんな風に役立っているのか。そして、「きれいな」ビッグデータとはどういうものなのか。3月28日、報道関係者らを招き、メルカリが活用しているAI技術について解説した。
多くのユーザーから自然とデータが集まるメルカリならではの強み
説明会で、AIの基本的な仕組みと、メルカリで使われている技術について解説した同社エンジニアリングディレクターの木村氏。同氏によれば、メルカリでAIを採用している部分は大きく分けて「簡単な売買」と「安心な売買」を目的とした分野となっている。
このうち「簡単な売買」のなかには、出品時に画像認識して商品情報を自動入力する「AI出品」、相場を自動判断して価格をリコメンドする「価格推定」、さらに米国ユーザー向けには出品情報から大きさを判定する「AI商品サイズ推定」という3種類の機能がある。
「AI出品」や「価格推定」は、メルカリで出品したことのあるユーザーならおそらく体験したことがあるだろう。
いずれも2017年から実装されている機能で、アプリから出品する際に写真撮影して登録すると、自動で「商品名」が入力される部分と、それが属すると思われる「カテゴリー」や「ブランド」が指定される部分に用いられ、ユーザーが入力した商品情報などをもとに「売れやすい価格」の範囲が表示される部分にも活用されている。
情報が自動入力されることで、ユーザーとしては手間を省いて出品しやすくなるだけでなく、適切な情報が登録できるため売れやすくなる効果が期待できる。値段の相場をすぐに把握できるのも、いちいち自分で類似の出品状況を調べる必要がなく、売れている実績のある価格帯で出品できることから、出品のしやすさと売れやすさの両方をかなえるものと言える。
こうした自動入力や価格のリコメンドを可能にしているのは、同社がこれまでに蓄積してきた「累計11億超の商品情報」から得られた画像やテキストなどの「大規模なデータセット」によるもの。ここにメルカリの強みがあると木村氏は語る。
AIを賢くするためには、通常はそれ相応の大量のデータが必要だ。例えば画像が何であるかを認識する場合、AIが勝手に判断できるようになるまでには、あらゆるパターンの画像に加え、各々の正解となる情報(タグ)を関連付けた形で集め、それらを事前に処理しておく必要がある。画像を認識するAIを開発しようとしたとき、その元となる学習データをどうやって集めるかは、AI開発にあたり常につきまとう大きな悩みとなっている。
メルカリの場合、AI開発に必須となるそのような大量の画像(商品写真)とタグ(商品情報)のデータが、ユーザーの手によってほとんど自動的に揃えられるのがアドバンテージになっているというわけだ。しかも、ほとんどのユーザーは商品が売れるよう、その商品しか写っていない「きれいな写真」を撮影するため、学習データとしての質も高い。
その分、逆さまに写真撮影したりすると「AI出品」の機能がうまく働かない場合もあるという弱点を抱えてはいるが、そもそもそういった出品の仕方では「売れない」わけだから、登録されることもまずない。したがって、メルカリとしてはイレギュラーなデータを想定した学習処理をしなくて済む。この部分もメルカリというサービスの構造上の強みとなる部分だ。
一般的な画像認識における学習過程では、あらゆるパターンを学習する目的と、数を集めるのが手間となるデータを水増しする目的で、同じ画像の上下左右を反転させたものを利用する場合がある。ところが、逆さまになった画像がユーザーによってまず登録されることのないメルカリではそれが不要だ。商品以外の“ノイズ”となるものが映り込んでいることも少ないので、個々の写真をあらかじめ“加工”する手間も少ないと考えられる。
つまり「きれいな写真」ばかりを処理すればいいため学習効率を高くでき、その分多くのリソースをかけなくて済むことになる。実際、同社エンジニアリングマネージャーの山口氏によれば、データ量は多いにもかかわらず、せいぜい同時に数台稼働させる程度のコンピューティングパワーで学習処理が間に合っており、精度の高い推測もできているという。
一方、AIを活用した「安心な売買」については、ユーザーだけでなく運営側も活用する機能。こちらも、メルカリに蓄積されている数十億規模とされる商品の関連情報や取引データなどが元となっている。偽ブランド品など出品が禁止されているものを検知する「規約違反検知」、未成年に販売出来ない商品を検知する「年齢確認商品検知」といったものがあり、この他にもユーザーからの問い合わせをカテゴライズして対応をスムーズにする「お問い合わせ自動分類」機能もテスト中としている。
メルカリでは、法令で販売が禁止されているものや、メルカリ独自の基準で出品を禁止もしくは制限しているものがある。そのようなアイテムが出品された際には、写真や商品情報などをもとにAIが「違反スコア」を算出し、一定の閾値を超えた場合にカスタマーサポートへ自動で通知する。その後、スタッフが目視して問題があると判定されれば出品情報が削除される仕組みだ。一連の手順は早ければ数秒で完了するため、ユーザーの目に触れることはほとんどないという。
カメラをかざすだけで出品に必要な情報が得られる仕組みも
メルカリでは今後、AI技術を重点領域とし、さらなるAIの活用に向けて社内体制を強化していくとしている。現在、同社でML(マシンラーニング)エンジニアと呼ばれるデータ収集やAIモデルの作成を手がけるスタッフは約20名、SysMLやML Opsと呼ばれる実装や運用を担当するスタッフが約10名の計30名体制。これを4月には10名新卒で採用し、10月にはさらに20名を採用して、計約60名と現在の倍に増員する計画だ。
体制を充実させるとともに、メルカリの各種機能もAIで強化していく。例えば「AI出品」は現在、本やゲーム、コスメなどのカテゴリーの商品だと、写真撮影するかバーコードを読み取るだけで商品説明や金額まで自動入力され、あとはユーザーが「商品の状態」を選ぶだけで出品できるような状況。これを他のカテゴリーにも広げる予定だ。
さらに、撮影するまでもなく、カメラをかざすだけでリアルタイムで商品を判定して相場価格帯を把握できるようにする技術を披露し、これを応用してより出品を簡単にする機能の実現を目指すとした。
また、iOS版で実現している、写真を撮影して類似商品を検索する機能についても、複数のアイテムが写った写真で、すべてが混在する形で一括検索できるようにする考えもある。将来的には通信やサーバーの負荷を低減する目的で、ユーザーの端末側でディープラーニングによる機械学習を行って写真検索するエッジコンピューティングも視野に入れている。
AI開発においても、学習の際のパラメーター設定やニューラルネットワークの作成をAI自体に行なわせるなどして効率化を進めていくという。現在同社内で活用している独自の機械学習プラットフォーム「Lykeion」の機能を拡充し、社外公開も検討する。
同社取締役CPOの濱田氏は、「インターネットの(一般化)前までは、街に出たり、電話やFAXで注文しないと商品を買えなかった」が、ECサイトの出現によって「買うことがものすごく簡単になった」としたうえで、「今度は我々が売ることを簡単にしていきたい。AIを使うことで、売るということを限りなく空気にしていきたい」と語った。