أربعة مصطلحات تُثير جنون العالم وعليك أن تعرفها – الجزء الثاني

في الجزء الأول تعرفنا على المصطلحات الأربع التي تجتاح عالم التكنولوجيا والأعمال مؤخرًا وتُنبئ بمستقبل تتفاوت الآراء حوله بين الترحيب به والحذر منه، والعلاقة بين تلك المصطلحات الأربع وأهمية أن تعرف مزيدًا من التفاصيل عنها. سنتناول كل مصطلح منهم بشرح أعمق في مقالات أخرى لتغطية كل الجوانب التي عليك أنت تدركها. في هذا الجزء نتناول «البيانات العملاقة» (Big Data) لنتعرف عليها بمزيد من التفاصيل.

ما البيانات العملاقة؟

منذ بداية الحضارة وحتى عام 2003، استطاع البشر إنتاج 5 إيكسابايت من البيانات، والآن نحن ننتج 5 إيكسابايت من البيانات كل يومين، والسرعة تتزايد

إريك شميدت – الرئيس التنفيذي لشركة جوجل

بداية لابد أن تعرف أن الـبيانات العملاقة ليست مجرد كميات متزايدة من البيانات فحسب. لكي يكون التعريف دقيقًا فهي أي كمية من البيانات الكبيرة والمعقدة بما يكفي لأن تعجز طرق التحليل التقليدية عن التعامل معها. وهذا التحدي لا يشمل تحليلها فقط، بل يشمل أيضًا جمعها، والبحث فيها، ومشاركتها، وتخزينها، ونقلها، وعرضها، وتأمينها أو انتهاك خصوصيتها.

ربما تجد صعوبة في تخيُّل حجم البيانات التي تندرج تحت وصف البيانات العملاقة. إذًا لنعطي رقمًا قديمًا نسبيًا. فحجم البيانات التي كانت تُصّنف كبيانات عملاقة في عام 2012 على سبيل المثال كانت تتراوح ما بين عدة مضاعفات للتيرابايت (1012) ومضاعفات البيتابايت (1015) ولكي تعرف ضخامة هذا الرقم يكفي أن تعرف أن أقصى سعة تخزين للقرص الصلب على حاسبك الشخصي الآن تتراوح ما بين 500 جيجا بايت (500 * 109) وواحد أو ربما اثنين تيرابايت فقط والتي تحتاج منك سنواتٍ لتملأها بالبيانات.

ولكن من أين أتت تلك البيانات فجأة؟
الحقيقة أنها لم تأتِ فجأة بل إنها نتاج طبيعي لما يسمى بـ (Datafication) وهو مصطلح لن تجد له مقابلًا باللغة العربية لكن يمكن أن يوازي «تراكم البيانات». هذا التراكم كان نتاجًا لعدة أشياء كظهور وسائل التواصل الاجتماعيّ، تحويل الكتب والموسيقى ومقاطع الفيديو إلى نسخٍ رقمية (Digital) وزيادة استخدام الإنترنت إلى جانب انخفاض سعر المستشعرات (Sensors) التي باتت تستخدم في كل الأجهزة لقياس كل شيءٍ وتتبعه.

حتى مهمة بسيطة كالقراءة بعد تحولها لنشاط رقمي أصبحت تنتج كمًا كبيرًا من البيانات

فكل نشاط رقمي تقوم به يترك خلفه أثرًا من البيانات الرقمية المتزايدة مع الوقت. فعلى سبيل المثال لا الحصر:

عندما كنت تقرأ كتابًا في السابق لم يكن ينتج عن نشاطك هذا أي بيانات، لكن الآن حينما تقوم بنفس النشاط باستخدام برنامج أو جهاز أو موقع إلكتروني لقراءة الكتب الإلكترونية مثل جهاز كيندل (Kindle) أو موقع جودريدز (Goodreads) مثلًا فإن نشاطك هذا ينتج عنه الكثير من البيانات التي يتم تسجيلها مثلًا كنوعية الكتب التي تفضل قراءتها وأسماء الكتب والمؤلفين والأوقات التي تعتاد القراءة فيها وسرعتك في القراءة أو معدل قراءتك وهكذا.

مثال آخر عندما كنت في السابق تستمع إلى الموسيقى من خلال أقراص مدمجة لم يكن ينتج عن نشاطك هذا أي بيانات، لكن الآن حينما تقوم بنفس النشاط باستخدام هاتفك الآيفون (iPhone) أو مشغل رقمي، تُسجّل عاداتك في الاستماع أيضًا مثل موسيقاك ومطربينك المفضلين وترتيب الأغنيات ومواعيد استماعك ومعدل ذلك وغيرها من البيانات.

وعلى ذكر الهاتف، علينا أن نذكر أن الهاتف الذكي يقوم باستمرار بتسجيل بيانات موقعك وسرعة تحركك ورسائلك النصية وأسماء معارفك الذين تتواصل معهم بشكل دوريّ وكيفية هذا التواصل .

يمكن دمج كل ذلك مع ملياراتٍ من عمليات البحث باستخدام محركات البحث يوميًا، ومليارات الجمل التي تكتب على وسائل التواصل الاجتماعي والمنشورات والتعليقات والإعجابات يوميًا، وملايين التغريدات على تويتر يوميًا، وما يقرب من المئة ساعة من مقاطع الفيديو التي يتم رفعها على يوتيوب كل دقيقة.

إنه لأمر مذهل ومجهد للذهن أيضًا. ولعلك تتساءل الآن، ما مقدار التزايد في حجم تلك البيانات؟

لنقتبس إذًا المثال الذي ضربه «إريك شميدت» الرئيس التنفيذي لشركة جوجل حين قال «منذ بداية الحضارة وحتى عام 2003، استطاع البشر إنتاج 5 إيكسابايت من البيانات، والآن نحن ننتج 5 إيكسابايت من البيانات كل يومين، والسرعة تتزايد».

الإكسابايت هو ما يعادل (1018) وحدة تخزين للبيانات «بايت»، ولا نبالغ حين نقول أن ما أنتجته البشرية منذ بدء الخليقة حتى عام 2008 سيتم إنتاج حجم مساوٍ له كل 10 دقائق عما قريب بسبب تزايد عدد الأجهزة المتصلة بالإنترنت كل يوم أو ما يسمى بـ «إنترنت الأشياء» (Internet of Things) الذي تحدثنا عنه في المقال السابق. فخلال عام 2008، فاق عدد الأجهزة المتصلة بالإنترنت عدد مستخدمي الإنترنت من البشر. واليوم، هناك أكثر من 10 مليار «جسم» (Object) متصل بالإنترنت، ويُتوقع ارتفاع ذلك العدد ليصبح 50 مليار جسم بحلول عام 2020.

والحق أن سعة التخزين التكنولوجية بالعالم كانت بالكاد تتضاعف كل 40 شهرًا منذ الثمانينيات. أما في العصر الحالي، صارت سعة التخزين في 2012 تبلغ 2.5 إكسابايت (2.5 * 1018) يوميًا، وفي 2014 أصبحت سعة التخزين 2.3 زيتابايت (2.3 * 1021) يوميًا والمزيد على الطريق.

باختصار فإن البيانات العملاقة هي هدف متحرك، فما هو عملاقٌ اليوم سيكون عاديًا غدًا.

ولهذه البيانات خصائص وسمات أساسية تُشكّلها وتُعرف بها بين المتخصصين:

  • الحجم (Volume) وهو أمر منطقي فهو الذي يحدد ما إذا كانت هذه البيانات تُصنف كبيانات عملاقة أم لا.
  • السرعة (Velocity) وهي سرعة إنتاج ومعالجة البيانات للوفاء بالمطلوب منها بتقديم تفسير لمشكلة ما.
  • التنوع (Variety) وهي الأصناف المختلفة للبيانات التي يتم تجميعها كالنصوص والصور ومقاطع الفيديو وسجلات المواقع وما إلى ذلك.
  • المصداقية (Veracity) وهي جودة البيانات، فدقة التحليل ترتبط بلا شك بأن تكون البيانات موثوق بها؛ فبعض البيانات تستحيلُ السيطرة عليها كالاختصارات والأخطاء الإملائية والكلمات الدارجة وما إلى ذلك .

وأحيانًا يضاف إلى تلك الخصائص أيضًا (Variability)، ويُقصد بها التضارب أو التناقض الذي يُشكل مشكلة لمحللي البيانات وتعيد البيانات (Complexity) من حيث الترابط والعلاقات والقيمة (Value) أي المدلول الذي يشير إليه تحليل البيانات فيما يخص المشكلة المطلوب بحثها فدون تحويل تلك البيانات إلى قيمة لا توجد فائدة من تجميعها.


هذا الكم من البيانات يحوي الكثير من المعلومات المفيدة جدًا لا في مجال العلوم فقط، بل وأيضًا في قطاع المال والأعمال والقصور في التعامل معها يُشكل عائقًا أمام محركات البحث، كما يعيق التقدم في كل تلك المجالات الأخرى. كل هذه البيانات من الصعب التعامل معها في زمن معقول نسبيًا باستخدام البرمجيات الحسابية العادية للتحليل والعرض ونظم إدارة البيانات على الحاسبات الشخصية، وتحتاج إلى أنواعٍ جديدة من البرامج وأساليب التحليل (Analytics) التي أشرنا إليها سابقًا، والحوسبة السحابية (Cloud Computing) كما أشرنا لكشف المعلومات القيّمة التي تحتويها وتُمكننا من فهم البشر والكوكب كله وتوقّع تطورات وعواقب ما يحدث اليوم.

بقي الآن أن تعرف من يستخدم هذه البيانات الضخمة؟ وأي المجالات ستعتمد عليها؟ وربما أوجه النقد الموجهة لها أيضًا. كيف يتم تجميعها؟ كيف يتم تحليلها؟ ما التكنولوجيا المطروحة بالأسواق التي تزيد من سيطرتها على حياتنا؟

هذا ما سنعرفه في الأجزاء القادمة.

المصادر
Wikipedia: Big DataWhat The Heck is... Big Data?Big Data: The 5 Vs Everyone Must KnowWhat The Heck is… The Internet of Things?
اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى