چکیده:
با گسترش شگرف اینترنت و شبکههای اجتماعی به عنوان اجتماعات مجازی و استفاده روزافزون از آنها، حجم انبوهی از نظرات کاربران در ارتباط با موضوعات مختلف پدید میآید. در نتیجه به کارگیری تکنیکهای علمی نوین جهت تحلیل این شبکهها ضروری به نظر میرسد. متنکاوی به عنوان یک راهکار ویژه و موثر، به دنبال کشف دانش از متون میباشد. در این مقاله، رویکردی نوین از ترکیب همزمان دو روش یادگیری ماشین و مبتنی بر واژگان جهت متن کاوی تحلیل احساسات در توییتر ارائه گردیده است. جهت بهبود متنکاوی تحلیل احساسات، و دستهبندی دادهها از درخت تصمیم CART به عنوان روش یادگیری ماشین، و برای کاوش دقیقتر در نوع احساسات بیان شده در توییتها از لیست الگوریتم SentiStrength به عنوان روش مبتنی بر واژه، استفاده شده است. ویژگی منحصر به فرد CART، تحلیل ساختار داده پیچیده است که با توجه به ورودی مسئله میتواند عملیات مربوط به رگرسیون، همچنین دستهبندی دادهها را انجام دهد. توانمندی الگوریتم SentiStrengthدر تشخیص احساسات، موجب تحلیل دقیق احساسات موجود در توییتها گردیده است. نتایج پیادهسازی جهت تشخیص احساسات توییتها، در اغلب شاخصها بهبود دستهبندی را نشان میدهد.
چکیده انگلیسی:
Today, with the enormous growth of the Internet and social networks as virtual communities and mass media, and increased use of them, a huge amount of user feedback comes from a variety of topics. Therefore, the use of novel approaches for analyzing them seems to be necessary. Text mining, as a special strategy, drives the knowledge discovery process, which uses non-verbal and attractive patterns of natural language processing. In this paper, a new hybrid approach of machine learning and vocabulary-based method to text-mining sentiment analysis on Twitter. To improve text-mining and sentiment analysis, the CART decision tree is used as a machine learning method for classification, also for extracting more precisely sentiment, we use from the list of SentiStrength algorithms as a lexicon-based method. CART is very effective in processing discrete and continuous data in text mining. The unique CART feature is a complex data structure analysis that can support regression as well as classification operations, according to the input of the problem. The ability and power of the SentiStrength algorithm to detect sentiment has also led to a thorough analysis of sentiment in tweets. The results of the implementation in the polarity recognition show improvement of classification in the most feature.
خبرنامه
برای ثبت نام در خبرنامه و دریافت خبرنامه ایمیل خود را وارد نمایید.