ما از مدل LDA به عنوان ویژگی روش استخراج برای استخراج موضوعات پنهان، کاهش اثرات پراکندگی داده، و ساخت ویژگی موضوع با مجموعه برای آموزش بیشتر مدل های طبقه بندی قوی برای دسته های مکمیاب استفاده می کنیم. آزمایش ها بر روی مجموعه ای از صفحات اینترنت از شاخه چینی ساده شده ی راهنمایی DMOZ انجام شد. نتیجه نشان می دهد که روش ها به بهبود عملکرد برای دسته های کمیاب برروی روش های طبقه بندی سلسله مراتبی براساس ترم و ویژگی کلمه و بهبود بیشتر عملکرد در کل موضوع طبقه بندی دست می یابد
واژگان کلیدی
با توسعه فناوری اطلاعات داده های اینترنتی و داده های الکترونیکی به سرعت در حال رشد هستند. به منظور سازماندهی موثر و مدیریت اطلاعات گسترده اینترنت، یک دسته، سلسله مراتب مفاعپهیم یا موصوعات بزرگ برای برچسب زدن به اطلاعات اینترنت و دسترسی آسان تر به اطلاعات استفاده شد، مانند راهنمای ODP و یاهو، سلسله مراتب معمولاً به ارتباط منظم جزئی علاقه دارد
Hierarchical classification with a topic taxonomy via LDA
Received: 23 May 2013 / Accepted: 21 September 2013
DOI 10.1007/s13042-013-0203-3
نرم افزارهای مورد نیاز جهت اجرای این نسخه : Matlab R2014b
توضیح مختصردر این مقاله مشکل پراکندگی داده دسته های کمیاب در مقیاس بزرگ طبقه بندی سلسله مراتبی بر روی موضوع طبقه بندی تحقیق شده است. اولاً ما مشکل پراکندگی داده دسته های کمیاب در طبقه بندی موضوع را تجزیه و تحلیل کردیم و یک مدل طبقه بندی سلسله مراتبی بر اساس LDA پیشنهاد کردیم. ما مدل موضوع برای هر گره غیر برگ در سلسله مراتب را توسط LDA یاد گرفتیم و ماتریس سند کلمه را به ما ماتریس سند موضوع تبدیل کردیم، سپس از یک روش بالا به پایین برای آموزش/تست استفاده کردیم. سپس، روش های بالا به پایین براساس روش استخراج ویژگی مختلف مقایسه شدند