أربعة مصطلحات تثير جنون العالم وعليك أن تعرفها – الجزء الرابع

تعرفنا في الجزء السابق على مزيد من التفاصيل عن البيانات العملاقة (Big data)، وعن أهميتها التي تكمن في الفوائد المرجوُّة من تحليلها، ودورها في تمكين الهيئات والأفراد من معرفة المزيد عن المشكلات المراد حلها والتنبؤ بها قبل أن تحدث، وكذلك تمكينهم من تحسين أداء العمل وتطوير التكنولوجيا والانتقال بها إلى آفاق أبعد بكثير مما هي عليه الآن. وتناولنا أيضًا بعضًا من الانتقادات التي وُجِّهت لها من قبل العامة والعلماء. في هذا الجزء سنتناول تفاصيل عن تحليل تلك البيانات والبرامج المستخدمة لذلك، وتوقعات حول دقة نتائج التحليلات وعواقب ذلك على الحياة المهنية للبشر.

الواقع يقول إنَّ الشركات التي ستتمكن من تحويل تلك البيانات إلى توقعات ذات قيمة هي التي سوف تبقى بل وستتقدم الصفوف، بينما تلك التي تتعامل معها بسطحية فستتأخر إلى الوراء. أما التي تتجاهلها تمامًا فسوف تتلاشى عما قريب. والحق أنه لا عذر للشركات ألا تستخدم تلك الخدمة المتاحة، فالأمر لا يستلزم تكلفة كبيرة بشكل عام (إلا في حالة تحليل بيانات مخصوصة)، وعليه فإن أصغر الشركات يمكنها ذلك بالفعل عن طريق استئجار خدمة تحليل بيانات (Software as a service-SAAS) بتكلفة زهيدة بدلًا من شراء رخصة برمجيات باهظة الثمن، مما يوفر لها فرصًا مكافئة.

ما البيانات التي يتم تحليلها؟

هناك فكرة مغلوطة ربما تخطر للشركات، وهي أنَّه لمجرد وجود البيانات فإن ذلك يتيح لهم ببساطة الحصول على نتائج مثمرة. في الواقع، لا يكمن السر في تجميع البيانات، فإن ذلك يغرق مُتخذي القرار بمزيد من البيانات، ولكن السر يكمن في «البيانات ذات الصلة» (Relevant data)، هذا يعني أن الشركة لا بد وأن تقرر أولًا نوعية البيانات التي تريد أن تجمعها بما يتوافق مع أهدافها الاستراتيجية والأسئلة التي تبحث عن إجابة لها؛ حتى يكون تحليل البيانات ذا إجابات دالة على مؤشرات نجاح التجارة. وهو الأمر نفسه الذي يجري تقليديًا في الواقع مع البيانات الصغيرة ويطلق عليه «مؤشرات الأداء الرئيسية» (Key Performance Indicators-KPI).

فإذا تم أخذ ذلك في الاعتبار وتم اختيار المؤشرات المناسبة، ستحقق الشركة القيمة القصوى من استغلال البيانات، ففي النهاية تلك المؤشرات تشمل هامش الربح ورضا العميل ونصيب السوق ونمو العائد وأداء الموظفين، وهي كلها المكونات الحيوية لأي عمل. وعليه يجب التوقف عن جمع أية بيانات والتركيز فقط على البيانات التي تؤدي للتوقعات الصحيحة.

ما مراحل التحليل؟

في البداية تحصل الشركة على بيانات من مختلف الأنواع كتسجيلات للمبيعات، وقواعد بيانات العملاء، وردود أو تعليقات من قنوات التواصل الاجتماعي أو البريد الإلكتروني، وأية بيانات يتم رصدها عن العمل الداخلي للشركة. وفي البداية يجب تحديد ما تحتاجه فقط منها وليس تحليلها كلها كما شرحنا.

ولأن حجم البيانات أضخم من أن تستوعبه وتتعامل معه حاسبات أي شركة، فإن تلك البيانات تتم استضافتها على نظم تخزين ملفات موزعة (Distributed File System) في خوادم (Servers) الإنترنت أو كما يطلقون عليها الآن السحابة (Cloud)، مما يضمن تخزينها بتكلفة زهيدة والوصول إليها ومعالجتها بسرعة أكبر بكثير من تخزينها في وحدة واحدة. من أشهر نظم التخزين المتوفرة حاليًا:Apache Hadoop, Distributed file system, Google File System. وإما أن يكون التخزين فيها على شكل الجدولة التقليدية مثل Hadoop أو الخروج عن تلك القاعدة والتخزين بطريقة تناسب البيانات وهو ما يطلق عليه NoSQL architecture المستخدَم مع Amazon’s DynamoDB (التي تستخدم نظام جوجل) وMongoDB، وCassandra (التي يستخدمها فيسبوك) ولكل منها قواعد خصوصية وحماية مختلفة.

ثم تأتي مرحلة التحليل Analytics وتختلف عن عملية التحليل Analysis، لأن الأولى هي تحليل «في السياق» أي يعطي تنبؤات أو توصيات؛ ويركز على المنهجية الكاملة وليس التحليل الرياضي فحسب. وهذا التحليل التنبؤي يشمل العديد من أساليب الإحصاء من النمذجة modeling وتعليم الآلة Machine learning والتنقيب عن البيانات Data mining وأدوات للتعرف على الأنماط أوتوماتيكيًا automated pattern recognition tools لتحديد التوجهات ورسم الاستنتاجات. والمثير أن أدوات التحليل الحديثة أصبحت غير مقتصرة على المحترفين نظرًا لصدور إصدارات أقل تعقيدًا تستخدم رسومًا وأرقامًا توضيحية للنواتج المحتملة. تلك الأدوات متوفر منها ما هو مجانًا ومفتوح المصدر مثل R وGNU Octave وApache Mahout: الذي صدر عنه Hadoop. ومنها ما هو تجاري مثل MATLAB وMathematica وFICO وغيرها. يمكنك التعرف على المزيد من خلال هذا الرابط: http://en.wikipedia.org/wiki/Predictive_analytics

المرحلة الأخيرة هي ترجمة التوقعات إلى لغة صناع القرار باستخدام رسوم توضيحية وتقارير توضح نوع التوصيات المقترحة ومدى التحسن المترتب عليها بالنسبة لبعض أو كل مؤشرات قياس الأداء. بذلك تكون الشركة فعلًا دخلت عالم البيانات العملاقة ويمكنها أن تحصد المنافع.

عواقب مُتوقعة

بقدرته على ترجمة وفهم الأسئلة باللغة الطبيعية للبشر، يُمثل حاسوب IBM «واتسون» مُستقبلًا لآلات يُمكنها أن تُغني عن وظائف عدة يشغلها البشر، مثل خدمة العملاء. – مصدر الصورة

تكثر التساؤلات حول دقة نتائج التحليلات وعواقب ذلك على الحياة المهنية للبشر.

حسنًا، لا بد أن نعترف أن تحليل البيانات له فوائد رائعة. فالتزايد المستمر للبيانات يتيح فرصًا لم تكن موجودة من قبل للعلم والتجارة وللمجتمع ككل كما أوضحنا بكثير من الأمثلة، لأنها تساعد على رؤية الصورة الكبيرة والفهم العميق وتحسين آليات اتخاذ القرارات وتقليل المخاطر وتفادي الجرائم، والتواصل بكفاءة مع الموظفين والمستهلكين على حد سواء، وغير ذلك.

ولكن من ناحية أخرى فإن تحسن القدرة على جمع وتحليل البيانات بهذا الشكل سيؤدي إلى ميكنة أغلب الوظائف، وهذا لا يشمل الأعمال اليدوية أو غير الحرفية فقط، بل سيمتد للمحترفين أيضًا من الأطباء والصحفيين والمدربين الرياضيين وغيرهم، والأمثلة على ذلك موجودة بالفعل:

آفاق جديدة

لكن، هل يعني ذلك أن البيانات العملاقة تحمل أزمة اقتصادية بدلًا من الرخاء والتطور؟
بالطبع لا. هناك دائما فرص جديدة. فكما شرحنا سابقًا أن هناك فجوة بين التطور المطرد للتكنولوجيا، وفهمنا واستخدامنا لها، مما يشكل فرصة للبشر لتضييق تلك الفجوة، والمؤشرات تتوقع تعيين 4.4 مليون شخص حول العالم بوظائف ذات علاقة مباشرة بتحليل البيانات العملاقة.

بناء على ذلك فهناك الكثير من المهن التي سيسطع نجمها مع انتشار البيانات العملاقة، ومنها:

عالِم بيانات (Data Scientist):
وهي قدرتك على التنبؤ بتوقعات فريدة من خلال تحليل البيانات العملاقة، وهي قدرة تأتي من خلفية أكاديمية ويطلب لتلك الوظيفة الحاصلين على درجة الدكتوراة، ولأنه أصبح مجالًا مهمًا يتقاضى العاملون به مرتبات كبيرة في ظل ندرة الخبرة المطلوبة فقد بدأت الجامعات في تقديم دورات مؤهلة بمقابل مادي كما في جامعتي ستانفورد وجون هوبكنز ومجانًا كما هو على موقع Coursera.

المهندس التقني (Technical Architect):
وهو الشخص المسئول عن إدارة البيانات العملاقة من برمجة واختبار وإعداد النظم وضبط الأداء. وذلك يستدعي معرفة بدقائق تقنية خاصة بنظم تخزين الملفات الموزعة ومهارات التحليل ونمذجة البيانات.

خبير تعليم الآلة (Machine Learning Expert):
وهي المقدرة على تعليم الآلة على مختلف الوظائف كالتجميع والتنقيب عن البيانات وترجمتها. وتحتاج مهارات البرمجة والتحليل.

مهندس هادوب (Hadoop Engineer):
المقدرة على التعامل مع برنامج Hadoop الذي هو العمود الفقري للتعامل مع البيانات العملاقة لأنه برنامج مفتوح المصدر تقوم كل شركة بعمل بعض التعديلات التي تناسبها وإطلاق إصدار جديد وتلك هي مهمة المهندس الذي يتميز بخبرة أكثر تعقيدًا من أقرانه في مجال تكنولوجيا المعلومات، ومعرفة أساسية بتكنولوجيات Hadoop وتكوينها الداخلي.

مسوّق تنفيذي للبيانات (Data Marketing Executive):
وهي مسئولية التواصل مع المستهلكين عبر مواقع التواصل الاجتماعي وحصد الآراء والتوقعات من خلال المحادثات وذلك يتطلب مهارات إدارة مشاريع قوية ومهارات عرض بشكل أساسي إلى جانب مهارات التواصل وتبسيط المعلومات والنظريات التقنية.

وحتى لا نحصر الأمر في وظائف بعينها، فالأمر ببساطة أن هناك فرصًا متاحة أمام كل الوظائف المتعلقة بتلك المهارات:


إن كنت قد أثارك الفضول وقررت العمل على البيانات العملاقة، فهناك مصادر مجانية تستطيع الحصول منها على تلك البيانات لتبدأ، تجدها هنا.

أما عن التكنولوجيات (الأجسام الذكية) المسئولة عن جمع تلك البيانات والتي تحدثنا عنها سابقًا (Internet of Things) وعن الخصوصية والحماية للبيانات، فتلك التفاصيل سوف نتناولها في المقالات القادمة.

المصادر
Bernard Marr: Is Big Data the Single Biggest Threat To Your Job?Bernard Marr: Top 5 High Value Big Data Use CasesBernard Marr: OUCH! When Big Data Turns Into Big Liability.Bernard Marr: We Have A New Data Gold Rush – Don’t Miss It!Bernard Marr: Meet Big Data’s Little BrotherBernard Marr: Big Data: The 4 Layers Everyone Must KnowBernard Marr: Big Data: The Predictions For 2015Bernard Marr: Big Data: The Key Skills Businesses Need
Exit mobile version