لعلك تقرأ هذا المقال بسبب عنوانه الشيق؛ “علم البيانات التخصص الأكثر إثارة في العالم”، ولكن عزيزي القارئ لم أكتب أنا هذا العنوان الصادم، بل كتبته المجلة العريقة هارفارد بزنس ريفيو.
ما هو علم البيانات؟ لماذا هو التخصص الأكثر إثارة في القرن الواحد والعشرون؟ هذا ما سوف نتناوله في مقال اليوم… اربط الأحزمة واستعد لرحلة ستغير تفكيرك وحياتك بأكملها.
ما هو علم البيانات؟
علم البيانات هو العلم الذي يتعامل مع كافة أشكال البيانات بداية من جمعها وتنسيقها وحتى تحليلها واستعراضها واستخراج المؤشرات الهامة منها، فهو العلم الذي يجمع بين مجالات علوم الحاسوب المختلفة، وعلم الإحصاء، بجانب عدد آخر من العلوم الحديثة الهامة.
لم تفهم شيئًا أليس كذلك؟ دعنا نقول إن علم البيانات مزيج من القدرة على سرد القصص والتنجيم، حيث يقوم عالم البيانات بسرد القصة التي يعرفها من الأرقام التي أمامه، ومن ثم يستخدم كرته البلورية لكي يتنبأ بنهاية قصته والسيناريوهات الأخرى التي كانت ستحدث كذلك.
وعلم البيانات هو الأساس الذي تقوم عليه العديد من التخصصات الشهيرة اليوم، مثل تعلم الآلة Machine learning، والتعلم العميق Deep Learning، بالإضافة إلى البيانات الضخمة Big Data، ولذا يعد من أكثر التخصصات المطلوبة في سوق العمل في القرن الحادي والعشرين.
وبالرغم من أن علم البيانات شيء يحتاجه ويمارسه البشر منذ قديم الزمان، إلا أن المصطلح “Data Science” لم يكتسب كل هذا الزخم إلا في العقود الأخيرة خاصة بعد اقتحام الإنترنت كل مجالات حياتنا، وما نتج عنه من كم ضخم من البيانات يقُدر بأضعاف أضعاف ما أنتجته البشرية طيلة وجودها.
لماذا علم البيانات بهذه الأهمية؟
نشرت مجلة هارفارد بزنس ريفيو في أكتوبر 2012 مقالة بعنوان “عالم البيانات: الوظيفة الأكثر إثارة في القرن الواحد والعشرين” لتسجل بداية الثورة الصناعية الرابعة التي تُعرف عالميًا باسم “ثورة البيانات”.
والتي يقودها المبرمجين وعلماء البيانات ومطوري الذكاء الاصطناعي الذين يقومون بتغيير عالمنا بسرعة جنونية من خلال جعلنا نولد كم هائل من البيانات ليحللوها ويدرسوها جيدًا.
لعلك لا تتخيل كم البيانات التي ننتجها لن أقول لك في اليوم، بل في الدقيقة الواحدة:
يتم ارسال 41,666,667 رسالة من خلال تطبيق واتساب.
يتم نشر 147,000 صورة على فيسبوك.
يتم مشاهدة 404,444 ساعة من الأفلام والمسلسلات على منصة نتفليكس.
يتم شحن 6,659 طرد من خلال أمازون.
وغيرها من البيانات التي لا يستطيع العقل البشري حتى أن يتصورها أو يتخيل حجمها.
وتُستخدم هذه البيانات لفهم سلوكنا ودراستنا وتوقع أفعالنا بعد ذلك من قبل شركات التكنولوجيا الكبرى، هذا غير أنها تساعد الشركات أيضًا على اتخاذ القرارات والتنبؤ بالمستقبل وتقليل المخاطر، وفي بعض الأحيان يتم استخدامها كمصدر للأموال من خلال بيعها.
ما الذي يدور حوله علم البيانات؟
يختص علم البيانات بعدد من العمليات الضرورية، والتي من الممكن اختصارها بأنها طرح سؤال ومن ثم الإجابة عليه، ولكن بشكل أكثر تعقيدًا حيث قد يكون هدف السؤال هو التنبؤ بظاهرة معينة، أو تصنيف بعض المعطيات، أو تحديد نمط ما في البيانات، أو توليد توصيات قبل القيام بخطوة مهمة، أو حتى لأغراض الحفاظ والتحكم بالجودة.
والأمثلة على هذه كثيرة للغاية مثل: توقع عدد مشترين سيارات هيونداي في شهر أبريل 2021، أو معرفة ما يطلبه المشترين من أمازون من الثلاجات، أو قياس سرعة بعض الخوارزميات الخاصة بتوقع الطقس، وغيرها من التطبيقات الكثيرة التي تشمل كل شيء تقريبًا في حياتنا.
يتم ذلك من خلال عدة مراحل تُعرف برحلة عالم البيانات.
وسأشرح هذه المراحل مع تطبيقها على مثال مبسط للتوضيح:
1. فهم المشكلة وسؤال الأسئلة الصحيحة
في البداية يقوم عالم البيانات بدراسة وفهم المشكلة ليقوم بطرح عدد من الأسئلة المحورية حول هذه المشكلة، والتي تؤثر تأثيرات كبرى عليها وتتحكم في الظاهرة محل الدراسة.
لنفرض أن عالم بيانات مرموق كان يقرأ أحد مقالاتنا، وأثناء مطالعته للمقالات كان لديه فضول كبير لمعرفة جودة مقالات الرابحون، فحدد الأسئلة المحورية التي ستساعده على معرفة جودة المقالات:
ما هو متوسط الوقت الذي يقضيه القراء في الموقع.
ما هي نسبة زائري الموقع الذين يعودون مرة أخرى لمحرك البحث جوجل لايجاد مصدر آخر للمعلومة.
ما هي نسبة الزوار الذين ينتقلون لصفحة أخرى في الموقع (دليل على أن المحتوى أعجبهم ويريدون المزيد منه).
ما هو متوسط عدد التعليقات على المحتوى.
ما هو متوسط المعدلات السابقة في المواقع الأخرى.
2. جمع البيانات المرتبطة بهذا السؤال
في الخطوة التالية يقوم عالم البيانات بجمع كافة البيانات الممكنة للإجابة على هذا السؤال من المصادر المختلفة، مثل قواعد البيانات، سيرفرات الإنترنت، استبيانات أو استطلاعات رأي يجريها وغيرها من المصادر.
من الممكن أن يقوم بعد ذلك عالم البيانات هذا بعمل استبيان ونشره على الإنترنت يسأل فيه الزوار إن كانوا يعرفون موقع الرابحون، وإذا كانوا يعرفوه أن يقيموا العوامل التالية بالأرقام من 1 إلى 5 حسب رأيهم:
جودة مقالات الموقع.
تفوق مقالات موقع الرابحون على المواقع الآخرى التي تكتب في نفس المواضيع.
سلامة المقالات من الأخطاء الإملائية والنحوية.
تأثير مقالات الرابحون فيك.
ومن ثم يسألهم عن عمرهم وبلدهم وجنسهم.
3. تجهيز البيانات وتحليلها
لتأتي بعد ذلك أصعب مرحلة في الأمر وهي مرحلة تجهيز وإعداد البيانات، حيث يقوم عالم البيانات بتنظيف البيانات وإزالة أو تصحيح أي بيانات قد تؤثر بالسلب على صحة نتائجه، ومن ثم يجمع البيانات المتبقية وينظمها في شكل عملي يمكن استخدامه في إجابة سؤاله.
كما يقوم عالم البيانات بفهم ما بيده وتحديد المفاتيح الرئيسية للبيانات، والمتغيرات الأهم التي ستكون مفتاح الإجابة على سؤاله، ليختار أفضل نموذج لتحليل البيانات.
ويقوم عالم البيانات بعد ذلك بجمع نتائج الاستبيان الذي قام بملئه 50 ألف شخص، ويقوم باستبعاد الأشخاص الذين لا يعرفون موقع الرابحون، ومن ثم يستبعد أيضًا الإجابات المكررة أو الناقصة، ليتبقى لديه 48 ألف إجابة مثلًا، ويدرك إن أهم متغير عليه التركيز عليه هو رأي الناس في جودة المقالات، ومدى تأثيرها عليهم ليختار بعد ذلك أنسب نموذج لتحليل البيانات.
4. تحليل البيانات واستخدام النتائج للإجابة على سؤاله
وها قد شارف عالم البيانات على الانتهاء من بحثه المضني، وسوف يجد أخيرًا الإجابة على أسئلته، ولكن تبقى عليه أن يحلل البيانات، ويقرأ النتائج لكي يسرد منها قصته، ويجاوب على السؤال الذي طرحه في البداية بنجاح.
بعد تحليل البيانات وجد العالم أن نسبة 99% من هؤلاء القراء قد أعطى لجودة المحتوى 5، وأن 89% منهم قد قيم درجة تأثير المقالات عليهم ب 5 أيضًا، فاستنتج عالم البيانات أن مقالات الرابحون عالية الجودة.
علم البيانات: عصا الإنسان السحرية
فكر فقط في كمية الأسئلة التي سيجيبها لنا علم البيانات، وتخيل ما الذي بإمكاننا فعله بكل تلك الأجوبة؟ حسنًا، لا تتعب نفسك كثيرًا في التفكير، فقط انظر حولك وتأمل كيف تصير الحياة أكثر بساطة ورفاهية بدءًا من اقتراحات نتفليكس الرائعة، وحتى تطور النظام الطبي في العالم، والحد من أخطار انتشار جائحة الكوفيد-19.
فعلم البيانات لا يختص فقط بالأمور الترفيهية والصناعية، بل هو عامل فعال من عوامل التقدم الطبي حول العالم، وهذا من خلال تطبيق سحره على البيانات الحيوية أو الطبية فيما يعرف بالمعلوماتية الحيوية أو الطبية.
فلولا معرفة البشرية بعلم البيانات لم نكن لنصبح قادرين على احتواء فيروس كورونا، ولا قادرين على الحد من أعداد مرضى السرطان في العالم.
ولكن عزيزي القارئ لا تعتقد أن علم البيانات مُستخدم في هذه المجالات فقط، بل هو مستخدم في كافة المجالات تقريبًا، فأي مجال أو صناعة مهما كانت تحتاج أو تستخدم البيانات بداية بالعلوم الإنسانية، وحتى صناعة الصواريخ مرورًا بكل شيء بإمكانك أو بإمكاني أن أتصوره أو أجهل حتى وجوده.
عالم البيانات الرجل الأوفر حظًا في العالم
بحسب الكثير من الإحصائيات فإن متخصصين علم البيانات هم أكثر الناس المطلوبين في العالم، ليس للعدالة بالطبع، ولكن لسوق العمل، فقد ظل تخصص علم البيانات هو التخصص الأكثر طلبًا على مر الأعوام السابقة حيث إن الطلب أكثر بكثير من العرض.
ولذا فإن رواتب علماء البيانات مرتفعة للغاية، حيث يبلغ متوسط راتب متخصصين علم البيانات في الولايات المتحدة يبلغ 113 ألف دولار سنويًا بحسب موقع Glassdoor الغني عن التعريف.
وإذا تحدثنا بالأرقام فإنه في العام 2020 كان هناك عجز في الولايات الأمريكية المتحدة فقط بحوالي 250,000 متخصص في علم البيانات، بينما يزداد سوق العمل بمعدلات جنونية وصلت إلى 39% في العام 2019، وارتفاع الراتب 14% في 2020 بسبب الحاجة إلى المزيد من متخصصين علم البيانات.
وإذا لم يكفيك هذا فإن المؤشرات تقول بأنه سيكون هناك عجز بالملايين في العقود القليلة القادمة.
قد تستعجب من هذه الأرقام والزيادات الجنونية في الراتب والطلب، بينما يعاني العالم من مشاكل اقتصادية كبيرة، ولك كل الحق في ذلك، ولكن علم البيانات وسائر التخصصات التكنولوجية الحديثة نسبيًا هي التي تقوم بتسيير العالم الآن والتحكم فيه وتغييره، ولذا مهما حدث فسنظل نحتاج إلى مهاراتهم وقدراتهم الخارقة مع التكنولوجيا.
أما في عالمنا العربي فهناك طلب أيضًا على المتخصصين في علوم البيانات، ولكنه ليس شديدًا مثل الولايات المتحدة ودول العالم المتقدم.
ولكن يتوقع الخبراء أنه في الأعوام القادمة سوف يزيد عدد الوظائف المعروضة، ولكن يمكنك في أي وقت أن تعمل من خلال منصات العمل الحر على مشاريع تتعلق بعلم البيانات وتعلم الآلة.
حيث يبلغ متوسط سعر الساعة لمتخصصين علم البيانات على منصة Upwork في العام 2019 حوالي 36 إلى 200 دولار في الساعة الواحدة حسب درجة المهارة والخبرة.
أفضل مصادر دراسة علم البيانات
قبل أن أذكر مصادر دراسة علم البيانات على أن أوضح أنه وعلى الرغم من أن غالبية الوظائف في هذا المجال تتطلب أن يكون لديك على الأقل درجة بكالوريوس في علوم الحاسب أو ما يماثلها، إلا أنه يمكن لأي شخص أن يدرس علم البيانات ويستخدمها في مجاله.
فإذا كنت طبيبًا أو صيدلانيًا يمكنك أن تدرس علم البيانات لتعمل في مجال المعلوماتية الحيوية أو الطبية، والتي تختص بالبيانات البيولوجية أو الطبية.
وإذا كنت تعمل في مجالات المال والأعمال فدراستك لعلم البيانات ستتيح لك أن تعمل في مجالات مثل تحليل المخاطر، تحليلات المستخدم، تحديد التلاعب المالي، وهكذا مهما كان تخصصك حتى وإن كان في العلوم الإنسانية.
أما عن دراسة علم البيانات، فعلى عالم البيانات أن يحترف عددًا من المواضيع على رأسها البرمجة والإحصاء وتعلم الآلة والخوارزميات المختلفة وقواعد البيانات، ولكن لحسن الحظ فإن الإنترنت يكتظ بالعديد من المصادر الرائعة لتعلم هذا المجال المهم كما أن منها من يبدأ من الصفر تمامًا.





ليست هناك تعليقات:
إرسال تعليق