


وبینار بهانه ای برای برنامه نویسی : کاوشی در پست های توییتر با پایتون
برگزار شده
وبینار بهانه ای برای برنامه نویسی : کاوشی در پست های توییتر با پایتون
برگزار شده
توضیحات
امروزه با توسعه ابزارهای ارتباطی نظیر شبکه های اجتماعی، پردازش زبان طبیعی (Natural language processing – NLP) محبوبیت و جایگاه ویژهای یافته است. بخصوص با ورود یادگیری عمیق به پردازش و فهم زبان، تحولی در این حوزه رخ داده است. شبکههای اجتماعی امروزه به عنوان یکی از اصلیترین فناوریهای تحت وب مورد استفاده طیف وسیعی از کاربران فضای مجازی قرار گرفتهاند. بنابراین شبکه های اجتماعی یکی از مهمترین منابع در تحقیقات و پروژه های داده کاوی هستند. توییتر به عنوان پرجمعیت ترین و پرمخاطب ترین رسانه اجتماعی مرجع مناسبی برای استخراج متون و تحلیل آنها است. به عبارت دیگر شرکت ها، موسسات تجاری، تحقیقاتی و دانشگاه ها و حتی دولت ها می توانند با تحلیل دادههای موجود در شبکههای اجتماعی، به مطالعه رفتار، علایق و بسیاری از جنبه های دیگر کاربران بپردازند.
یکی از فیلدهای مهم پردازش زبانهای طبیعی در چنین مطالعاتی، پردازش متن است.
برای دستیابی، تحلیل و مطالعه حجم عظیم داده های تولید شده در شبکه های اجتماعی ابزار های متنوعی وجود دارد که براساس پردازش زبان طبیعی و روش های یاد گیری ماشین تلاش می کنند تا تحلیل درستی از متون بدست آورند. خوشبختانه امروزه برای پردازش متن ابزارهای (کتابخانههای) بسیار مفید و منبع باز، بخصوص در زبان پایتون، ایجاد شده است که محققان براحتی می توانند از آنها استفاده کنند.
در این وبینار با توجه به سهولت کدنویسی و فراگیر بودن پایتون و همچنین وجود بسته های نرم افزاری زیاد، این زبان برنامه نویسی و مهم ترین ابزار آن برای پردازش زبان های طبیعی یعنی NLTK را برای انجام پروژه انتخاب کرده ایم.
کتابخانه NLTK یکی از جامعترین و قدیمیترین کتابخانههای پردازش زبان طبیعی در پایتون است. این کتابخانه پایه و استانداردی برای کتابخانههای پردازش متن محسوب شده و برای کاربردهای پژوهشی فوقالعاده است. یکی از ویژگیهای خوب این کتابخانه امکان اتصال به پیکرههای مختلف متنی است.
تلاش ما اینست که در این وبینار ضمن پوشش سرفصل های ارایه شده، انگیزه لازم برای ورود به این حوزه جذاب را در مخاطب ایجاد کنیم.






