[4]ビックデータを用いたバーチャルオフィスの会員審査

[4]ビックデータを用いたバーチャルオフィスの会員審査

Joe’sビジネスセンターを運営していて、最も神経を使うのが、入会時の審査です。最近頻発している、バーチャルオフィスを悪用した投資詐欺について、どのように食い止めるかということが、業界全体での課題になっています。
 

Joe'sビジネスセンター(銀座 大会議室)


Joe’sビジネスセンターでも、現会員数が1000、累積では2,000以上にもなります。過去7年間に問題のあった方は全体の15名程度(1%未満)ですが、1件でもそういう事件があれば、犯罪者が多くいるようなことがマスコミなどで報道されてしまいます。
 
最近、ビックデータとかデータマイニングという言葉を耳にする機会が増えましたが、Joe’sでも、過去の蓄積されたデータから、統計学に基づいて、審査を行うことを検討しています。もちろん、今までも過去のデータは利用してきました。ただ、判断には主観的な要素が強く、また、決定に時間がかかることもありました。
 

投資詐欺のためにバーチャルオフィスが悪用されるケースがあるという


データから、その申請者が会員になった場合に何%の確率で問題をおこすかを、RというOSS(オープンソースソフトウェア)に計算させます。例えば、自宅住所=東京、業務=ソフトウェア開発、年齢=30という条件で会員を申請した人の中で、何%の人が犯罪を犯しているかを検索します。このデータは、申請はしたが、会員にならなかった人の追跡も必要です。
 
昨年も「統計学は最強の学問である」という書籍が25万部を超えるベストセラーになりました。ただ、この手の統計処理は、例えばクレジットカードの審査などで何十年も前から行われてきました。その意味では、今回の検討がまったく新規というわけではないかもしれません。

統計学は最強の学問である


 
統計学では、大まかに言って、2種類の誤りがあります。善人を悪人とみなす誤りと、悪人を善人とみなす誤りです。前者の誤りを一定の確率(危険率, 1%,5%など)で許容し、後者の確率を最小にする統計的検定を行うことになります。善人であることを仮定(帰無仮説)すると、その人のレコードに含まれる項目の値が異常(危険率以内にはいる)ということがわかれば、善人であるという仮説が棄却されます。
 
また、各レコードのどの項目を用いると、正しい結論が得られるのか、回帰分析、モデル選択のような統計処理を行う必要も生じます。

Rは、OSSは統計パッケージとして広く利用されている


 
現在は、大学の先生に指導を頂いています。理論的に特に新しいことはないが、そのような応用は意義があるだろうと言われています。方法が確立した段階で、学術的な研究会で成果を発表する予定です。Joe’sビジネスセンターでは、バーチャルオフィスの健全な運営に向けて、最大限の努力をしていく所存です。