عرفنا في الجزء السابق أنًّ كل شيء نقوم به وسنقوم به في المستقبل سيترك خلفنا آثارًا رقمية تتزايد بشكل عملاق كل ساعة وكل يوم، وأن وصول تلك البيانات إلى الأحجام الضخمة التي هي عليها اليوم هو ما نطلق عليه البيانات العملاقة أو Big data، وأنًّ تلك البيانات بقدر ما تحوي من معلومات هامة في باطنها إلا أنها من التعقيد الذي تعجز عنه وسائل التحليل التقليدية، والحاسبات العادية من التعامل معها بالتخزين، والتحليل، والمشاركة، وغير ذلك في زمن معقول نسبيًا، مما يستلزم التعامل معها بأدوات، وطرق تناسب طبيعتها المختلفة من حيث الحجم، والسرعة، والتنوع، والمصداقية، والتعقيد، وأيضًا القيمة. في هذا الجزء نتناول المزيد من التفاصيل عن البيانات العملاقة ونتعرف سويًا على استخداماتها الواسعة التي تحيط بنا ولا ندركها.
يجب أنْ تدرك أنًّ طبيعة البيانات العملاقة تختلف بشكل كبير، فليست كل البيانات مُهيكلة ويمكن وضعها في جداول وإدراجها في برامج التحليل كأرقام. ولعل الصور ومقاطع الصوت والفيديو خير دليل على ذلك، بل إنًّه من المدهش والمزعج أيضًا أن تعلم أن نسبة ضئيلة جدًا تمثل حوالي 20% فقط من البيانات العملاقة هي «بيانات مُهيكلة» (Structured Data) والباقي كله والذي يتزايد بشكل مخيف هو بيانات عشوائية غير مُهيكلة (Unstructured Data) لا يمكن تنسيقها في جداول كالبريد الإلكتروني ومنشورات ومحادثات وسائل التواصل الاجتماعي وما إلي ذلك.
إذًا، كيف نستخدمها أو نقوم بتحليلها؟
دون الدخول إلى تفاصيل سيتم تناولها لاحقًا في أجزاء أخرى، الحوسبة السحابية (Cloud Computing) بالتضافر مع أساليب تحليل مطورة ومبتكرة (Analytics) تقوم بها برمجيات خاصة لهذا الغرض (Hadoop) وتعمل على عدة حواسيب فائقة السرعة بطريقة موزعة كلٌ منها يعمل على مجموعة بيانات مختلفة الحجم والنوع تستضيفها خوادم الإنترنت، قد أغنت الجميع عن شراء حاسبات فائقة أو بناء شبكات. وذلك يعني أنَّه بداية من الحكومات، والهيئات، وقطاعات الأعمال، والقطاعات الخاصة وصولًا إلى الأفراد يمكنهم جميعًا استخدام البيانات العملاقة لفهم المشكلات، وتحسين آليات اتخاذ القرار.
من يستخدم تلك البيانات؟
والحق أن سؤال «لماذا» هو الأشمل لأنه لنفس السبب تتنافس الكيانات في السوق لتحقيق نفس الهدف. والأسباب حقًا متعددة ومتنوعة أيضًا، كالحصول على «تجارة ذكية» (Smart Business) أو «رعاية طبية ذكية» (Smart Healthcare) أو «مدينة ذكية» (Smart City) أو «رياضة ذكية» (Smart Athlete) وصولًا إلى «المنازل الذكية» (Smart homes) وحتى «علاقة حب ذكية» (Smart love). وهذه ليست أمنيات أو ضربًا من الخيال، فهي أمثلة واقعية تحدث الآن بالفعل.
التجارة الذكية
مثلًا ستجد شركة مثل eBay.com وAmazon.com تستخدم البيانات العملاقة للبحث عن الترشيحات التي تقدمها للعملاء، وفهم التعليقات، ومعرفة ذوق المستهلك، واختيار العروض المناسبة. بل إن الشركات تستخدم تحليلات فيسبوك وتويتر لتحديد حجم المبيعات وانتشار العلامات التجارية إلكترونيًا. ويمكن للمتاجر الكبيرة بسهولة تتبع بيانات العملاء من خلال مشترياتهم وبيانات البطاقة الائتمانية وتقديم العروض الملائمة لهم عند ملاحظة تغيير نمط الشراء والاستهلاك. الأمر نفسه الذي تفعله شركات الخدمات كشركات الاتصالات وباقات القنوات الفضائية وتأجير الأفلام لمعرفة مستوى رضا العميل عن الخدمة التي يتلقاها وتفادي مخاطر انتقاله إلى شركة منافسة. نفس الأمر يمكن استخدامه لاستبقاء الموظفين الأكفاء. وبذكر الخدمات وفيسبوك، لابد أن نذكر أيضًا أن الشركة تستخدم بيانات الصور الشخصية التي يقوم المستخدمين برفعها لتقديم خدمات مثل ترشيح الأصدقاء (People You May Know).
وهناك شركات شهيرة أخرى في مجالات متعددة تنتفع من البيانات العملاقة مثل شركة “Uber” لتأجير السيارات وشركة “AirBnB” (وهي خدمة إلكترونية تساعد الناس على تأجير غرف بمنازلهم تمامًا كالفنادق). وربما تستغرب أن شركات بيع السجائر الإلكترونية “Smokio” تنتج تطبيقًا يتابع نمط تدخين المستهلكين، بينما توجد شركات أخرى تساعد المدخنين على الإقلاع عن النيكوتين مثل “QuitBit” و”IntelliQuit”. وحتى على صعيد التعليم، تستخدم “Coursera” المؤسسة الهادفة للربح البيانات العملاقة في مجال تقديم الخدمات التعليمية والتفوق على أقرانها.
الرعاية الطبية الذكية
هناك مثال عليها هو تحول وحدات رعاية الأطفال المرضى والمبتسرين إلى تحليل البيانات العملاقة الناتجة عن تسجيل معدلات التنفس والنبض والمؤشرات الحيوية للأطفال على الأجهزة طوال الوقت ومعرفة أنماط تطور المرض. الأمر الذي يمكنهم من التنبؤ بالمضاعفات قبل أن تحدث بالفعل بمدة لا تقل عن 24 ساعة.
المدينة الذكية
مثل توقع مواقيت ومواقع ازدحام الطرق ووسائل المواصلات من البيانات العملاقة التي تُجمع من الشوارع، وإشارات المرور، والأحوال الجوية، ورسائل مواقع التواصل. وهي نفسها المعلومات التي استخدمتها شركة جوجل لإنتاج سيارتها ذاتية القيادة (Google’s Self-Driving Car) التي تقوم المستشعرات فيها بجمع تلك البيانات.
ليس ذلك فحسب بل بتجميع معلومات وسائل التواصل كالرسائل والصور مع معلومات المكالمات الهاتفية يمكن توقع حدوث أي جرائم أو يمكن تتبع مرتكبيها والقبض عليهم. وبذكر الأمن أيضًا فإن تتبع نشاطك على المواقع الإلكترونية قد يحميك من القرصنة إذا ثار اشتباه حول استخدام بيانات بطاقتك الائتمانية في نشاط غير مألوف، فيمكن إيقاف التعامل بها تلقائيًا وحمايتك من المزيد من الخسائر.
وعلى الصعيد السياسي فإنه يمكن للسياسيين أن يتوقعوا بتحليل البيانات أيضًا مواقع المنافسة الشديدة والتي تحتاج إلى جهد أكبر منهم في الدعاية لبرامجهم الانتخابية. ولا تقتصر الاستفادة بتلك البيانات على السياسيين فقط، بل إن الفنانين يفعلون ذلك أيضًا! فالمغنية المشهورة «ليدي جاجا» تستخدم بيانات أنماط الاستماع لدى الجمهور لاختيار أغنياتها التي تقوم بتقديمها في الحفلات الحية.
الرياضة الذكية
مثال عليها هو تحليل البيانات المجمعة من كرة بيسبول أو تنس ذكية مزودة بعدد كبير من المستشعرات (Sensors) لتحليل أداء اللاعب من خلال أسلوب وسرعة ضرباته. أو البيانات المجمعة من مستشعرات بدرّاجات السباق أثناء التدريب لتقييم الأداء. أو حتى الساعات والأساور التي تجمع المؤشرات الحيوية للاعب ومعلومات عن معدل حرق السعرات وجودة نومه ومستوى التدريب وسرعة العدو وربما دمج ذلك مع التعليقات التي تصله على صفحاته الشخصية على مواقع التواصل الاجتماعي لمعرفة مدى تأثُّر معنوياته بتعليقات الجمهور.
المنازل الذكية
مثال على ذلك مقياس الوزن الذكي، والثلاجة الذكية، والتلفاز الذكي، والمدفأة، وسخان المياه، وكل تلك الأجهزة التي تستشعر استخدامك وتُحلّل ذوقك العام وتُعدِّل من أدائها وفقًا لذلك التحليل بل وتتنبأ بالأعطاب وترسل طلبًا للصيانة تلقائيًا عبر هاتفك.
علاقة الحب الذكية
مثال عليها هو ما يقوم به موقع مثل “eHarmony” الذي يحلل بيانات الأزواج مع أنماط شخصيتهم ومهاراتهم الاجتماعية من خلال استبيان إلكتروني يملؤه من يريد التعرف على شريك يناسبه، فيمكنه من خلال التحليل أن يوفر لك شريكًا «مشابهًا» لك ربما لا تصل إليه أبدًا بنمطك المعتاد في الاختلاط بالناس. موقع آخر هو “Perfectmatch.com” يستخدم البيانات بأسلوب آخر فيوفر لك شريكا «مكملًا» لنمط شخصيتك بدلًا من ذلك.
السلبيات
كل ذلك يبدو جميلًا، لكن ماذا عن سلبيات ذلك؟ ما من شيءٍ مثاليّ تمامًا.
من المؤكد أنَّ القلق يساور العامة عمّن يملك تلك البيانات ومن يقوم بتحليلها، ومع من يشاركونها ولأي غرض. بالإضافة إلى ذلك فإنًّ النقد الأوسع انتشارًا حول البيانات العملاقة يدور حول انتهاك الخصوصية خاصةً بعد تصريح «إدوارد سنودن» وتسريبه لمعلومات تثبت تورط وكالة الأمن القومي الأمريكية (National Security Agency – NSA) في فضيحة جمع وتسجيل المكالمات الهاتفية والأنشطة على وسائل التواصل الاجتماعي لملايين المواطنين الأمريكيين. والأمر لا يقتصر فقط على بيانات مثل هذه، فبيانات التسجيلات الطبية بشركات التأمين مثلًا أو سجلات التعاملات النقدية بالبنوك لا تقل أهمية عن ذلك. وعلى ذكر المعاملات النقدية، فقد تم بالفعل اختراق بيانات حوالي 110 مليون مواطن أمريكي مسجلة لدى 1700 فرع لمتاجر “Target” العملاقة في مطلع عام 2014، وكانت هذه البيانات تستخدم لاستطلاع مؤشرات السوق، مما تسبب للشركة في أزمة قوية في سوق الأعمال تحاول جاهدةً الخروج منها واستعادة ثقة عملائها.
كما أنه على الصعيد الآخر ستتكون بالتدريج احتكارات في قطاع الأعمال، إذ ليست كل الشركات قادرة على تحمل تكلفة النوع الأكثر احترافًا من تحليل البيانات، مما يعطي الشركات الكبيرة فقط الأفضلية في تحويل السوق دائمًا إلى مصلحتها.
أما بالنسبة للعلماء، فربما ينقدون أمرًا آخر وهو الفكرة، والأسلوب. فالبعض منهم يرى أن تجميع البيانات بذلك الشكل دون وضعها في سياق محدد قبل التحليل يجعل الأمر غير ناضج بما يكفي لاتخاذ القرارات، بينما يعترض البعض الآخر على أن تجميع البيانات بذلك الشكل يتنافى مع أسس البحث العلمي من اتباع شروط التمثيل للعينة المستخدمة في البحث وأنه ربما بالفعل تكون البيانات المستخدمة لعينة متحيزة وهو الأمر الذي لا يمكن الاعتماد على نتائج تحليله.
والآن وبعد أن عرفت أكثر عن البيانات العملاقة لعلك بالتأكيد متشوق لتعرف كيف يتم التحليل وما البرامج المستخدمة فيه، وما النتائج المتوقعة إذا انتشر استخدامه، وعما إذا كانت نتائجه دقيقة بالفعل، وإن كان ذلك يعني استبداله للكثير من نظم العمل والوظائف البشرية.
سنشرح ذلك بتفصيل أكبر في الأجزاء القادمة.