「ビッグデータ」とは何ですか?誰がそれを収集しているのですか?


親愛なるライフハッカー様
「ビッグデータ」についてよく聞くようになりました。それは何ですか? 心配する必要がありますか?これは企業が私のデータを収集して販売する別の方法なのでしょうか?

心から、
流行語に魅せられて

流行語に魅せられて、
「ビッグデータ」が最新テクノロジー業界の流行語。誰に尋ねるかによって、それは個人のプライバシーに対する脅威であるか、データ処理とコンピューティングの革命であるかのどちらかです。初めからこれを言います。「ビッグデータ」は、非常に多くの人々にとって非常に多くの意味を持ち、まったく意味を持たなくなる危険性があります。そうは言っても、誰もが同意する場所はいくつかあります。飛び込んでみましょう。

「ビッグデータ」のさまざまな意味

ウィキペディアの定義ビッグデータとは、「非常に大規模で複雑なため、手持ちのデータベース管理ツールや従来のデータ処理アプリケーションを使用して処理することが困難になっているデータセットの集まり」を指します。これは理にかなった定義であり、科学者、経済学者、統計学者がそれを説明する最も一般的な方法です。簡単に言うと、「ビッグ データ」とは、簡単に入手できるものの、現在のコンピューティング テクノロジに挑戦するほど膨大な量の情報を指します。ビッグ データは、複数のソース (コンピューター、衛星、モバイル デバイス、カメラ、マイクなど) から情報が入ってくるときに発生する問題です。その情報は移動し、保存し (たとえば、ペタバイトやエクサバイトのことです)、処理する必要があります。

それだけならもう終わりだ。残念なことに、「ビッグデータ」は、使い古されたマーケティングフレーズにもなった。ソフトウェア会社や IT サービス プロバイダーは、自社製品の優位性や人材の質を顧客 (および競合他社) に伝えるためにこれを使用します。新興企業やシリコンバレーの有力企業は、「当社のシステムはビッグデータがもたらす課題に対応できる」「当社のデータサイエンティストはビッグデータの扱い方を知っている」と主張するのが好きだ。残念ながら、これらの発言は実際にはそうではありません言う多くの。

「ビッグデータ」としてカウントされる情報も水を濁します。多くの企業は、収集および処理できるデータについて話すときにこの用語を活用しています。人々、特にそのユーザー。データ製品をより良く販売したり、マーケティング活動をターゲットにしたり、販売するためのより良い製品を作成したりするのに役立ちます。。プライバシー擁護派もその定義に固執し、人々の私生活や個人データへの新たな侵入としての「ビッグデータ」に反対する運動を展開している。しかし、科学や金融の世界では、「ビッグデータ」は気象観測所の気象データから世界中の金融取引所の市場データに至るまで、あらゆるものを指します。これらのデータセットはすべて元の定義に当てはまりますが、その用途、およびその情報を収集する人々に関連する意味合いは根本的に異なります。

ビッグデータが問題になる場合

では、「ビッグデータ」と聞いて何を考えるべきでしょうか?それはこのフレーズを使用する企業によって異なります。もしあなたが聞いたこともないテクノロジー系スタートアップ企業が、自社の「猫の写真を処理するアルゴリズムは、ビッグデータを管理できることを意味している」こと、そして自社のサービスが「[y 名詞] の [x 社] のようなものである」ことを誇りに思っているとしたら、おそらく懐疑的になるはずです。この会社が、インターネット上のすべての猫の写真を集約して意味を理解する革新的な方法を持っている可能性は明らかにありますが、それはマーケティング スローガンである可能性の方が高いです。同様に、この用語は、サービスがマーケティング目的でデータを収集する以上のものであると誤解させるためによく使用されます。 Acxiom、CoreLogic、DataLogix などのいわゆる「データ ブローカー」がこのフレーズを使用しているのを聞いた場合、彼らは確かに管理すべきデータが大量にありますが、彼らはこのフレーズを次のことを説明するために使用しています。誰から収穫できるか、どのように加工できるか、そして誰に販売できるか。

しかし、医療会社が、何千もの分院や研究機関からの患者記録、電子文書、実験論文の取り扱いに伴う課題について話しているのを聞いたら、おそらくこの用語の正当で科学的な使用法に注目していることでしょう。さらに、会社もありますソフトウェアの提供を専門とする病院、金融管理会社、研究機関、政府機関に特にデータの課題に対処するために提供します。聞くとDARPA はビッグデータを管理する新しい方法を求めていますが、それが合法であることはご存知のとおりです。同様に、NOAA、NIH、NASA などの科学組織や研究機関がビッグ データの課題について語る場合、これは流行語ではないでしょう。 IBM、Oracle、SAP、または SAS の新しいデータ処理テクノロジーの広告を見ている場合は、あなたはおそらく明らかですそして彼らはこのフレーズを本来の意図どおりに使用しています。

あなたにとってビッグデータが意味するもの

ビッグデータは、どこかのデータセンターで行われるはるか遠くの数値計算のように感じるかもしれませんが、現実世界に影響を及ぼします。プライバシー擁護派は懸念している 膨大な情報についてこれらは、簡単にアクセスできる (そして多くの場合安全ではない) データベースに保存され、自由に販売または取引できます。企業や政府機関は、情報の断片を使用して、個人、その活動、購入、読書、閲覧の習慣などの全体像を構築することは難しくありません。何よりも、識別可能なものを自分で収集する必要がなく、入手したものを任意の目的に使用できます。

明るい面としては、ビッグ データの問題が、ビッグ データの有用性の一部であるということです。それは非個人的で文脈のないものです。データが良いからといってそれを使用して行われた決定が同様に適切であるという意味ではありません。たとえば、Google Flu Data はすべて正しいことを行い、すべての適切な場所から情報を入手しましたが、2年連続で感染率を誤って予測。つまり、誰かがあなたの像を構築できるかもしれないが、データ自体は依然としてあなたの行動や選択を正確に予測できないということです。ビッグデータは、多くの情報が飛び交っていることを意味するかもしれませんが、それでも適切なスキルセットを備えた人間が必要となります。情報を精査し、適切な決定を下す収集したものに基づいています。これらの決定がどうなるかは時間が経てば分かるだろう。

一般の人にとって、これは 2 つのことを意味します。1 つは、あらゆるものについて収集される膨大な量の情報が、良くも悪くも使用される可能性があることです。この議論は今後数年間にわたって展開されるため、「ビッグデータは悪、プライバシーは善」というような単純なものではないことに注意してください。データはまさに情報です。問題はその使い方だ

第 2 に、他の新興分野と同様に、データ サイエンスへの関心 (および機会) が急増するでしょう。もちろん、フレーズを意味のないところまで薄める、綿密なマーケティングも行われるでしょう。しかし、これは新しく進化するテクノロジーのフロンティアであり、スキルを習得することに興味がある場合は、参加できるものです。

結論: ビッグデータについて心配するのではなく、誰がそれを使用しているかを心配しましょう

結局のところ、ビッグデータとその管理でビジネスを営む企業は、科学、技術、医学における偉大なイノベーションへの道を切り開いています。気候、遺伝学、病気と医学、物理学などを研究するために、これまで以上に多くの情報が利用可能になり、処理されています。しかし、消費者側としては、あなたが発言権を持たないあなたについての意思決定をするために、あなたの人生やライフスタイルがより多く活用されることを期待してください。企業が私たちについてもっと学ぼうと躍起になるにつれ、一見無関係に見える業界でさえ、ある企業にとって突然役立つようになるでしょう。もう 1 つは、あなたのショッピング習慣は健康保険会社にとって有益であり、あなたのインターネット閲覧習慣は金融サービス会社にとっても有益です。もちろん、そうでない限り、あなたはプライバシーを保護するための措置を講じています

これで少しでも空気が晴れるのを願っています、Bewitched。これは奥深いテーマであり、成長産業であるため、常に変化しています。ただし、バズワードと事実、科学とマーケティングを区別することが重要です。これがお役に立てば幸いです。ただし、流行語がばかげているように見えても、トレンドが消えるわけではないので、動向に注目してください。

心から、
ライフハッカー

Ask Lifehacker に質問や提案がありますか?に送信してください[メールで保護されています]

タイトル画像を使用して作成しましたカルロス・イエロー(シャッターストック)とピパットビッグ(シャッターストック)。追加の写真トニー・ダウラーインテル フリープレスコグニザントテクノロジーソリューション、 そしてシュレヤンク・グプタ