1
/
5

言語学系エンジニアの私がスタートアップに入社して気づいた、「MNTSQ社内言語」の面白さについて語る

こんにちは。2021年6月にMNTSQ(モンテスキュー)株式会社に入社しました、坂本明子(Akiko Sakamoto)です。

アルゴリズムエンジニアという職種で、自然言語処理を主に担当します。

入社から約1ヶ月が経ちましたが、カジュアル面談から実際に入社するまでに感じていたこと、そして入社後に実際に体感した面白さを入社エントリーとしてまとめてみました。リーガル、テック、セールスの各職種が密に連携して、市場に受け入れられるSaaS製品を作っている会社の雰囲気が、少しでもお伝えできますと嬉しいです。

1.MNTSQに入社した動機4つ

1-1.契約書の言葉に対する興味

中高の頃から英語を話すのが好きでした。初対面の人とでも、言語を変えれば、自分たちの好きな話題で盛り上がれるような、「言葉は通じなくても話は通じる」という状況を楽しいと思っていました。大学では英文学科で言語学(正確には、生成統語論や意味論)を勉強しました。特に、文の構造や、意味の構造を考えることが好きでした。一旦言語学の修士に進みかけたのですが、数学の先生の講演を聞いたことがきっかけで、文法とコンピュータを合わせれば機械翻訳になるのではないかと思い、専攻を変えて、自然言語処理の修士を修了しました。

その後、仕事では、同時通訳の研究開発や音声認識の製品化のために、話し言葉のデータ分析に11年携わりました。当時、音声翻訳が流行り始めたころで、音声認識した結果を意味のまとまりごとに区切って機械翻訳エンジンに渡せば、同時通訳ができるのではないか!という発想から生まれた技術でした。

同時通訳の短期学校に(休日に自腹で)通って、同時通訳者の方の頭の中ではどのような処理を行っているのか、工学的な観点から整理し、機械に行って欲しい動作を文法規則として書き起こす部分を担当しました。結果、話し言葉を書き言葉に変換する規則ベースの言い換えモジュールが完成しました。

話し言葉というのは「という風に」や「あの」といった意味を持たない、間合いを埋めるための言葉を含んだり、明示的な文末表現がないまま、ずっと話がつづいて、文と文の境目がわかりにくかったりします。このまま機械翻訳にかけても、「風」が”Wind”になったり、文が長すぎて解析に失敗したりしがちです。

この言い換えモジュールにかけると、話し言葉テキストを意味のまとまりごとに区切って、話の意味を変えない程度に、話し言葉特有の冗長な表現を除去した出力を得られます(坂本・田中2015)。この簡潔にした後の日本語を機械翻訳に渡せば、機械翻訳側でも誤作動が少なく翻訳を行えるという発想でした(釜谷他2013)

この後、技術が製品に載ることになり、技術と人が一緒に事業部へ異動して、製品化のプロセスを経験しました。音声認識SaaSビジネスを行う部門に所属し、セールスや技術の方と幅広く関わることができました。

製品化プロジェクトが一段落したので、新しい目標を考え始めました。次は、書き言葉を分析して意味解析に踏み込みたい考えていたところ、取締役の堅山からLinkedInのメッセージを受けとりました。カジュアル面談にて「契約書には、文字でしか表現できない事象(音声や図解では表しにくい事象)が書かれているのではないか」とたずねてみると、その様子でしたので、ぜひ取り組んでみたいと思い、入社を志望することにしました。

1-2. 事業戦略と会社組織に対する興味

選考に進むことが決まり、企業研究の材料を探したところ、社員ブログTechブログが見つかりました。4人の取締役以外は管理職がないと書いてあるほか、エッジの効いた書き手がのびのびと綴っていて、指示待ちではなく提案型で動いている会社のように見えます。入ってみると、本当に、忖度禁止&根回し不要で議論が捗る会社でした。

MNTSQが長島・大野・常松法律事務所(以下、NO&T)と共同で刊行した書籍では、よく練られた事業戦略が勢いよく書かれており、これを当時の本業の傍ら2年で書いた著者達が作った会社の日常に興味を持ちました。

また、入社してみると、製品が良ければ売れるわけでもないことは前提として扱われ、市場の声に合わせた製品作りをすることに、取締役も社員も全力であることが分かりました。リーガルチームやバックエンドのテックの社員から、「フロントの動向を見聞きしたい!セールスチームの会議も出てみたい!」という声が上がっており、交流も盛んです。

1-3. 機械学習の使い方に対する興味

選考では、自分が受けている職種の社員と、具体的な課題を通じてディスカッションする機会があります。その過程で堅山から「機械学習はふしぎな装置ではない」といわれ、目から鱗でした。つまり、機械学習は、ブラックボックスとして使うものではなく、仕組みを理解してある程度制御しながら使う道具であるという立場に刺激を受けました。

私はこれまで言語学の背景を利用して、規則ベースの自然言語処理(人間が言葉を話す時の考え方を分析して機械が真似できるように記述するアプローチ)を使っており、統計ベースの自然言語処理(機械学習や深層学習を用いた、機械にデータの傾向を統計で把握させるアプローチ)については、挙動を制御しづらくて正直とっつきにくいと思っていましたので、そんな言葉が出るくらい機械学習を使いこなしている方と、一緒に働いてみたいと思いました。

1-4.ドメイン特化型の自然言語処理に対する興味

個人的には、言葉が意味を伝えられる仕組みについて興味があり、自然言語処理技術でも意味に踏み込んだ処理が行いたいと考えていました。意味解析は自然言語処理の一連の過程でも後段に位置しており、前段までの解析精度に左右される分野でもあるため、扱いにくさもあります。

契約文書はドメイン特化型のコーパスの中でも、特に、形式面が整った文書であることが期待できるので、テキストの意味解析まで踏み込んでいける可能性が高そうです。

これから機械学習や深層学習を勉強して使う際にも、詳しい社員が既に複数在籍しているのは心強いです。

さらに、これがMNTSQの一番の特徴だと思いますが、アノテーション(※)の定義や実作業を担当しているリーガル人材が社内に在籍しています(※契約業務のDXを推進するSaaS製品MNTSQを支えるアノテーションについては今泉のブログをご覧ください。)。アノテーションの判断理由を知りたい場合に、法律実務における言葉の意味や使いかたについて、とことん教えてもらえます。法律用語の辞典で解説されている用例と、実運用の場面での使い方がずれている見出し語が存在することなどを、隣席の弁護士に気軽に聞けます。このような環境は、とても助かり、ありがたいことです。

2.入社後の感想

入手後、契約書の分析に入る前に、チームで製品コードを書くためのソフトウェア・エンジニアリングについて、勉強することになりました(当然ですね)。

まずはチーム開発に参加するための共通言語として、GitHubの仕組みや運用方法を学びつつ、Webアプリの仕組みや、APIの使い方、作り方を急ぎ勉強しています(ここができないままテック枠で入社してくる人は、後にも先にもいないと思います)。

そういうわけで、言葉の分析は少し先延ばしになるかと思ったのですが、Slackと通して社員とやり取りするうちに、「リーガルテック開発を支える人材の多様性をカバーし円滑に意思疎通する目的から生まれた社内言語が発達していて面白い」ということに気づきました。

契約書を解析する製品を作るための言語、いわばMNTSQ語との出会いが予想外だったので、下記に感想を述べます。

2-1.予想外の答えが1週間で返ってきた

MNTSQでは、大小様々な意思決定が、ものすごい勢いで毎日行われています。これは、リーガルテック事業のためのベストプラクティスを目指していて、今の技術で、お客様に提供できる価値は何かを全員が徹底的に考え Raise issueしている(ちょっとした違和感から、具体的な解決策に至るまで、様々な粒度の提案をしている)ためです。

ツールはGitHubとSlackを使っているのですが、その上に乗せるディスカッションを、効率良く、透明性高く行えるよう、考え方や行動指針がドキュメントに明文化されています。日々、状況が変化する市場をターゲットとしているため、ドキュメントと実態が合わなくなって来たときにメンバーの意見をすり合わせてドキュメント更新の合意形成を迅速に行う習慣が仕組みとともにちゃんと機能しています。

各方面の専門家が集まっていて、濃い議論が短時間にまとまって行く様子が面白いです。お互いの分野の専門用語を習得しているほか、社内用語の造語パターンがいくつかあり、新語(未知語)が、話し言葉でも書き言葉でも飛び交っています。

はじめは聞き取りや解釈に一苦労しました。話し言葉の場合は、後から用語の意味を聞くと、命題単位の内容が返ってきます。例えば、「かけなおし」という言葉をよく聞くので何かと聞いてみると、言語処理のモデルを更新したので、あるお客様環境のデータに対して再度かけるという内容が返ってきます。インフラチームの文脈では、デプロイ作業にまつわる諸々を指し、リーガルとアルゴリズムチームの文脈では、処理内容の変化の評価を指します。その時にいるメンバーを見ながら、何のことを指しているか掴むのに、1週間くらいかかりました。対面の会議が異様に短い理由の一つだと思います。

また、書き言葉の場合、略語が暗躍するのは主にSlackのやりとりなのですが、メンバー達がカスタム絵文字機能を使いこなしており、信頼関係の維持や構築は2秒で済ませて別の仕事に取りかかります。

下図の例を見ると、絵文字が表意文字のように、発音を介さずに使われている様子が伝わってきます。はじめにAさんが本文のテキストでペアオペを依頼して、Bさんが「OK」のジェスチャーの絵文字で返し、さらにAさんが「ありがと」というSlackのカスタム絵文字で返しています。「ありがとう」系の絵文字も複数あるのですが、Slackの対話を眺めていると、このなかから文脈に応じて使い分けているようです。



(注記:2つある「神」のうち、左側の「神」はモノクロですが、右側の「神」はgifアニメで七色に光ります。ちょっと難しい内容の共通課題を皆のためにシュッと終わらせた人が現れた時などに使います。)

なるほどこれなら、話し言葉でも書き言葉でも、手短な言葉のやりとりで、猛スピードで議論が進むわけだと納得しました。

とはいえ、いくら社内用語で話者数が限定されていても、曖昧性を備えた単語ももちろんあります。会社が大きく成長する過程にあるので、入社時期の異なる人同士で意味が異なる場合もありますし、話者の背景の違いによる捉え方の揺れもあります。そんな現象が見つかったときには、Slackやオフラインで語釈に関する議論が見聞きされており、わずか30人の社員が使う言葉であっても、現実世界(社外の日常の日本語)と同様の議論が観察されて、興味深いです。(そのようなわけで、すべてSlackや略語で済ませているわけではなく、必要に応じて対面の会話も行っています。)

2-2.そんな答えが1週間で返ってくる背景

上記の感想は、対面およびSlackの対話を通じて、最初の一週間で得たものです。1週間で言葉に対する感想が持てたのは、既に入社していたメンバーが、Slackや対面で沢山話しかけてくれて、「話していいんだよ!伝えて!」というメッセージを全力で送ってくれたからです。

各方面の専門家が意見を出し合って仕事上の議論を練るために、その土台となる日常的な心理的安全性を担保する工夫がなされています。入社直後は毎日コーヒータイムがあり、毎日様々な業種の4〜5人で、好きなことを話します。その後は週一のペースで続きます。

入社から2週間少々の段階で、既にリーガル、セールス、カスタマーサクセス、広報、インフラ、検索、自然言語処理といった各分野のメンバーと沢山話をさせて頂き、いろんな視点にふれることができて、楽しいです。

書きたいことが盛りだくさんで、内容を端的に表すタイトルをつけられずにいたところ、取締役にして星新一賞作家の安野にタイトルをつけて頂けるという予想外の展開となりました。ありがとうございます。

2-3.これから挑戦したいこと

コーパス分析を通じた規則ベースの自然言語処理で一芸入社してしまったので、これから機械学習、深層学習、ソフトウェアエンジニアリング、そして、製品のモチーフとなる法律と契約書について、知識とスキルを深めて行きたいです。

2-4.どんな方におすすめな会社か

個人的な感想ですが、下記に該当する方は、カジュアル面談だけでも、楽しいと思って頂けるのではないかと思いました。

・建前なく本音のやりとりがしたい方。

・異業種の社員と日常的に協業することに興味がある方。

・チームワークの方法に悩んでいる方。

・市場に受け入れられる製品作りの過程に興味のある方。

・がっつり、テックと協業してみたいセールスの方。

MNTSQ社では、一緒に働いてくださる方を募集しています!

MNTSQ, Ltd.'s job postings
9 Likes
9 Likes

Weekly ranking

Show other rankings
Invitation from MNTSQ, Ltd.
If this story triggered your interest, have a chat with the team?