-
شماره راهنما
۸۴۸
-
پديد آورنده
كريمي،معصومه
-
عنوان
يك روشتركيبي جهت بهبودتشخيص نام بيماري در متون پزشكي
-
عنوان به انگليسي
A Hybrid Method to Improve Disease Name Recognition in Biomedical Texts
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر
-
محل تحصيل
تهران شمال
-
سال تحصيل
۱۳۹۶
-
تاريخ دفاع
۹۶/۱۱/۱۱
-
وضعيت پايان نامه
۱۸
-
مشخصات ظاهري
۸۴ص،
-
يادداشت
پردازش زبان طبيعي
-
استاد راهنما
فراهي،احمد
-
توصيفگر فارسي
پردازش زبان طبيعي , تشخيص نام بيماري , تطبيق فازي
-
توصيفگر لاتين
Named Disease Recognition , Natural Language Processing , Conditional Random Field
-
چكيده
كي از وظايف اساسي براي ساخت سيستم هاي پردازش زبان طبيعي (NLP)در حوزه پزشكي، شناسايي و تشخيص نام بيماري از متون پزشكي ميباشد؛ بنابراين يكي از روشها جهت NER پزشكي، روشهاي مبتني بر يادگيري (ML)است كه عملكرد نسبتا خوبي دارد، اما اغلب در اين روش نياز به مقدار زيادي از نمونههاي حاشيهنويسي جهت ايجاد دادههاي آموزشي را دارند كه به دليل نياز به افراد متخصص جهت حاشيهنويسي بسيار گران و هزينه بر ميباشد. لذا در اين پژوهش در گام اول، قصد داريم براي ايجاد دادههاي آموزشي به صورت خودكار از روش AL با رويكرد كاهش هزينه حاشيهنويسي استفاده كنيم. سپس در گام دوم با استفاده از دادههاي آموزشي ايجادشده از مرحله قبل روشML را با كمك الگوريتمCRF ايجاد كرده و با تركيب اين روش با تطبيق فازي به دنبال بهبود دقت NER جهت تشخيص نام بيماري خواهيم بود.
جهت ارزيابي، روش پيشنهادي بر روي مجموعه دادههاي مرتبط با بيماري NCBI و BioCreative VCDR مورد بررسي قرار گرفت شده است. نتايج به دست آمده نشان ميدهد كه روش ALميتواند هزينههاي حاشيهنويسي و ساخت دادههاي آموزشي را بهبود دهد و تا حد زيادي ميتواند نياز به افراد متخصص را كاهش دهد. سپس روش پيشنهادي مورد بررسي قرار گرفت كه نشان ميدهد با تركيب روش ايجادشده توسط الگوريتم CRF و روش تطبيق فازي، ميتوان دقت تشخيص نام بيماري را بهبود داد.
-
شماره ركورد
54983
-
لينک به اين مدرک :