টেক ইন্ডাজট্রিজ এর মধ্যে মেসিন লার্নিং এবং ডেটা সাইন্সের উপর অনেক বেশি টাকা পেমেন্ট করে থাকে। এবং এই চাকরির সব থেকে বেশি ডিমান্ড আইটি সেক্টরে। যার অন্যতম কারন এই সেক্টরে দক্ষ ডেভেলপার খুব কম পাওয়া যায়। এর সাথে সাথে একটা রিসার্স এ জানা গেছে ২০২৫ পর্যন্ত বাংলাদেশে ডেটা সাইন্সের যেই সেক্টর আছে তা ৯ বিলিয়ন ডলারের থেকেও বেশি।
আজকের এই পোস্টে আমি আলোচনা করবো ডেটা সাইন্স নিয়ে! ডেটা সাইন্স কি? কেন শিখবেন ডেটা সাইন্স এবং ডেটা সাইন্স কিভাবে কাজ করে এইটার রোড মেপ সহ আরো অনেক কিছু।
ডেটা সাইন্স কী?
উদাহরন
আমাদের মধ্যে প্রায় সকলেই ইউটুব ফেসবুকের মত সোসিয়াল সাইট গুলোর মত আরো অনেক ওয়েব এ্যপ্লিকেশন ব্যাবহার করেছি। এইসব প্লাটফোর্মে লক্ষ্য করলে দেখবেন আপনি কোন একটি ভিডিও অনেক্ষন ধরে দেখলে বা সার্স করলে এর পর থেকে অটোমেটিক তার নিচে বা সাইডে অই রিলেডেট ভিডিও শো করানো হয়। যেমন ধরুন আপনি একটু ভূতের ছবি দেখছেন ইউটুবে, এখন লক্ষা করলে দেখবেন এই ভিডিওর নিচের সকল ভিদিও ৯৯% ভূতের ছবি রিলেটেড। এ ছাড়াও আমরা যদি ইমেইল চেক করি তাহলে লখ্য করবেন মাঝে মাঝে Spam এই অপশনে কিছু ইমেল থাকে যা হয়তো কোন হেকিং রিলেটেড বা কন প্রোমশনাল ইমেল। আর এই ইমেল গুলো ইমেইস সার্ভার বা সিস্টেম অটোমেটিক ট্রাক করতে পারে।
ডেটা সাইন্স কী?
এই অটো সিস্টেম অটো কম্পিট এই সকল ফিচার গুলো ডেটা সাইন্স এর মাধ্যমেই কাজ করে। ডেটা সাইন্সের মানে হলো অনেক গুল ডেটা একসাথে করা এবং অইটাকে এনালাইসিস করা, এবং অই ডেটাকে প্রসেস করা অইটাতে প্যটার্ন খুজে বের করা ইত্যাদি। Artificial intelligence, Machine learning, Deep Learning এই সকল কিছু ডেটা সাইন্সের অংশ।
ডেটা সাইন্স ৩ ভাগে বিভক্ত
- ডেটা কালেক্ট করা
- ডেটাকে এনালাইস করা
- ডেটা থেকে কিছু ইউজফুল তথ্য বের করা
আজকের তারিখে সোসিয়াল মিডিয়া অনেক বেশি, ইন্টারনেট ব্যাবহার কারীও অনেক বেশি। প্রতিদিন পৃথিবীতে প্রতি সেকেন্ডে কত ডেটা স্টোর হয় যা বলার বাহিরে।
প্রথমে যখন ইন্টারনেট আবিষ্কার হয়, যখন মানুষ টেকনোলজি খুব একটা ব্যাবহার করতোনা। তখন ডেটা অনেক কম ছিলো। তখন ডেটা স্প্রেড ফোর্ম বা এক্সেল ফোর্মে লিখে রাখতো। তখন ২-৩ টা কোম্পানি থাকতো এই ডেটা গুলো নট করার জন্য ও এনালাইস করার জন্য। কিন্তু আজকের দিনে ডেটা এত্ত বেশি যে ডেটাকে এখন ডেটা বললে ভুল হবে ডেটাকে এখন বিগ ডেটাও বলা হয়।
এত এত ডেটা প্রসেস, এনাইলাইস করা কোন স্বাধারন মানুষের পক্ষে কোন ভাবেই সম্ভব না । তাই বর্তমানে এরকম সফটওয়্যার আছে, এলগরিদম আছে তাছাড়া এরকম মেসিন আছে যা আমাদের হয়ে ডেটা এনালাইসিস করে দিবে।
এইসকল জিনিস গুলো নিয়েই ডেটা সাইন্স এবং ডেটা সাইন্সের মধ্যে আরো অনেক ইন্টারেস্টিং কন্সেপ্ট আছে।
ডেটা সাইন্সের সুবিধা
ডেটা সাইন্স অনেক পাওয়ারফুল একটি টেকনোলজি, যা দিয়ে বর্তমান সময়ে- বিজনেস সমস্যার সমাধান, রিয়াল লাইফ সমস্যার সমাধান, মজাদার প্রজেক্ট তৈরি করা। গুগল সার্স ইঞ্জিনের মত প্রযুক্তি ডেটা সাইন্স ও এলগরিদমের মত টেকনলজি অনুসরন করে। ফেসবুকে, ইউটুবে লখ্য করলেই দেখা যায় গুগলে যেই বিষয়টা নিয়ে বেশি সার্স করি ফেসবুক তা অটো মেটিক আমাদের সামনে উপস্থাপনা করে একিভাবে ইউটুবত আছেই। টেক ইন্ডাজট্রিজ ডেটা সাইন্স ছাড়া কিচ্ছু না।
ডেটা সাইন্স কিভাবে শিখবো
ডেটা সাইন্স শেখার অনেক উপায় আছে আমি নিচে কিছু স্টেপ দিচ্ছি যা ফ্লো করে আপনি ডেটা সাইন্স শিখতে পারবেন।
- Learning a programming language. ডেটা সাইন্স শেখার জন্য প্রোগ্রামিং সব থেকে গুরুত্বপুর্ন। বর্তমান সময়ে ২টা মোস্ট পপুলার ভাষা আছে ডেটা সাইন্সের মধ্যে যার মধ্যে #১ হচ্ছে Python এং #২ হচ্ছে R. ২টাই খুব জনপ্রিয় তবে Python সবাই বেশি ব্যাবহার করে কারন এটাতে লাইব্রেরি বেশি থাকে যা R Programming এর তুলনায় কম।
- Learn Statistics বেসি স্ট্যাটিস্টিক তো আমরা ক্লাস ৯-১০ এই শিখেছি! কিভাবে কি শিখলে মনে থাকে এবং 11-12 এ থাকতে আমরা যেই ম্যাথ গুলো শিখেছি সেই গুলো মনে থাকলেই যথেষ্ট।
- Data Visualisatione এখন ডেটাকেত আমরা দেখে নিলাম কিন্তু এক্সেল বা কোন স্প্রেড শীটে থাকা তথ্য গুলো পরা বা বুঝা অনেক গুরুত্বপুর্ন যা সহজে বোঝাও অনেক মুশকিল। এবং এর জন্যই আমরা ডেটা ভিজুলাইজ করতে পারি। এক্সেল বা অন্যান্য স্প্রেড সিস্টেমে গ্রাফ বানাতে পারি ইত্যাদি।