ارسال پیشنهاد

1

تعداد پیشنهاد ها

اشتراک گذاری

گزارش تخلف

گزارش مالی

هوش مصنوعی

هدف این پروژه پیاده‌سازی الگوریتم‌های طبقه‌بندی و خوشه‌بندی، طراحی خزنده، و ارزش‌گذاری مقالات و رتبه‌بندی نویسنده‌ها بر اساس اطلاعات جمع‌آوری‌شده توسط خزنده است. طبقه‌بندی و خوشه‌بندی : در این بخش از پروژه قصد داریم طبقه‌بندی و خوشه‌بندی را روی داده‌های متنی موجود در دیتاست AG News انجام دهیم. داده‌های این دیتاست از سه بخش تشکیل شده‌اند: عنوان خبر، متن خبر، و دسته‌ی خبر. داده‌ها (خبرها) در این دیتاست 4 دسته می‌باشند که این دسته‌ها به‌صورت زیرند: World : 0 Sports : 1 Business : 2 Sci/Tech : 3 با توجه به اینکه نمی‌توان مدل‌های طبقه‌بندی و خوشه‌بندی را به‌طور مستقیم بر روی داده‌های متنی آموزش داد و آزمود، در ابتدا باید این داده‌ها را به شکل عددی تبدیل کنیم. برای این کار روش‌های مختلفی وجود دارد. یکی از این روش‌ها، استفاده از الگوریتم tf-idf و اعمال تجزیه SVD (به‌منظور کاهش ابعاد) برای ایجاد embedding متناظر با متن می‌باشد. با استفاده از قطعه کد زیر، عملیات گفته‌شده را اجرا می‌کنیم. طبقه‌بندی : در این بخش سه مدل Naïve Bayes، k-Nearest Neighbors و SVM را بررسی می‌کنیم. به ازای هر یک، در ابتدا مدل را با استفاده از داده train، آموزش داده و سپس با استفاده از داده vaidation، به بررسی کلی عملکرد و تنظیم هایپرپارامتر و ویژگی‌های مدل می‌پردازید و بهترین مدل را با توجه به صحت (accuracy) مدل انتخاب می‌کنید. در بخش ارزیابی به بررسی عملکرد مدل‌های انتخاب‌شده بر روی داده test بر اساس معیارهای گفته‌شده، می‌پردازید. توجه داشته باشید که به ازای هر خبر، سه نوع embedding متناظر با آن خبر داریم و درنتیجه به ازای هر الگوریتم، باید سه مدل را به عنوان مدل نهایی انتخاب نمایید. یعنی 9 مدل در انتها باید بر روی داده test متناظر بررسی شوند. این مدل‌ها به‌صورت زیر می‌باشند: مدل naïve bayes آموزش داده شده روی ستون vec_1 یا embedding حاصل از عنوان خبر مدل naïve bayes آموزش داده شده روی ستون vec_2 یا embedding حاصل از متن خبر مدل naïve bayes آموزش داده شده روی ستون vec_3 یا embedding حاصل از ترکیب عنوان و متن خبر مدل knn آموزش داده شده روی ستون vec_1 یا embedding حاصل از عنوان خبر مدل knn آموزش داده شده روی ستون vec_2 یا embedding حاصل از متن خبر مدل knn آموزش داده شده روی ستون vec_3 یا embedding حاصل از ترکیب عنوان و متن خبر مدل svm آموزش داده شده روی ستون vec_1 یا embedding حاصل از عنوان خبر مدل svm آموزش داده شده روی ستون vec_2 یا embedding حاصل از متن خبر مدل svm آموزش داده شده روی ستون vec_3 یا embedding حاصل از ترکیب عنوان و متن خبر ارزیابی : با استفاده از معیارهای ارزیابی زیر، عملکرد مدل را روی داده تست بررسی نمایید و مدل‌ها را با هم دیگر مقایسه کنید. Accuracy Precision Recall F1-score Confusion Matrix با توجه به اینکه مسئله طبقه‌بندی این پروژه از نوع چند کلاسه می‌باشد، از macro معیارهای ذکرشده، استفاده نمایید. توجه داشته باشید که می‌توانید از امکانات کتابخانه sklearn برای این قسمت استفاده نمایید. باقی توضیحات در فایل پروژه ... لطفا فایل با نام Phase3.ipynb را بازکنید توضیحات وجود دارد

miladnazirzadeh
miladnazirzadeh

امتیاز : 0/5

یادگیری ماشین (Machin Learning)
فایل ضمیمه
rar

پروژه هوش مصنوعی.rar

1.5 مگابایت

تایم لاین پروژه

درخواست پشتیبانی
  • در انتظار پرداخت

    پرداخت تعرفه ثبت پروژه های غیر رایگان

  • در حال بررسی

    برسی و تایید پروژه از طرف مدیرت سایت

  • آماده دریافت پیشنهادها

    تایید پروژه و نمایش برای مجریان

  • در انتظار پرداخت هزینه پروژه

    پرداخت هزینه اجرای پروژه توسط کارفرما

  • در انتظار پرداخت ضمانت اجرا

    پرداخت مبلغ ضمانت اجرا توسط مجری

  • در حال انجام

    پروژه شما درحال انجام می باشد

  • انجام شد

    اتمام اجرای پروژه

لیست پیشنهادها

Niko
2 سال پیش
  • اطلاعات پروژه
  • 1140کد پروژه
  • برنامه نویسی با زبانهای مختلف ، طراحی سایت و نرم افزار

    دسته بندی
  • 02 بهمن 1400تاریخ ثبت
  • 6 روزمهلت اجرا
  • 600,000 تومانحداقل بودجه
  • 650,000 تومانحداکثر بودجه
  • 5 درصد ضمانت اجرا
  • آماده دریافت پیشنهادها وضعیت