هایدی

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

هایدی

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

دانلود مقاله پردازش اطلاعات در ذهن

اختصاصی از هایدی دانلود مقاله پردازش اطلاعات در ذهن دانلود با لینک مستقیم و پر سرعت .

دانلود مقاله پردازش اطلاعات در ذهن


دانلود مقاله پردازش اطلاعات در ذهن

تاریخ نشانگر تغییر و تحول بسیار در عصرهای مختلف می‌باشد. با هر نسل ابزارها، سنت‌ها و عقاید جدید رشد می‌کنند و این موضوع در آغاز قرن بیستم از جایگاه ویژه‌ای برخوردار است. نظام‌های اجتماعی، اقتصادی، سیاسی در حال تحول می‌باشند. ابزارهای جدید موجب پدید آمدن روشهای نوین و نیز چالش در اندیشه انسانی شده و با این چالش تفکرات جدید متولد می‌شوند و در نتیجه نظام‌هایی متنوع و سازگار با نیازهای اجتماعی جدید خلق می‌شوند. زمانی که ایده مرتبط ساختن کامپیوتر به وسیله تلفن در سال 1965 به وسیله دو نفر از محققان به نام‌های لری رابرتز (Lary Roberts) و توماس مریل (Thomas Merril) مطرح گردید و توانستند دو کامپیوتر یکی در کالیفرنیا و دیگری در ماساچوست را به هم وصل نمایند هیچ کس تصور نمی‌کرد که این فناوری بتواند چنین تحولی در جوامع بشری ایجاد کند. در سال 1972، رابرتز اولین حافظه E-mail را نوشت. در سال 1980 ساخت کامپیوترهای شخصی با سرت و حافظه بیشتر توسعه یافت و در دهة 1990 با طراحی شبکه جهانی وب  (world wideweb) و گسترش ناگهانی اینترنت تحولی عظم در فناوری اطلاعات به وجود آمد که این فناوری بر روی دانش، آموزش، یادگیری، ارتباطات و دهها مقوله دیگر تأثیر بسزایی گذشت و این موضوع آنچنان سریع رخ داد که بسیاری از دست‌اندرکاران، سیاستگذاران و رهبران آموزش عالی را حتی در کشورهای پیشرفته غافلگیر نمود. به طوریکه پیش بینی می‌شود پس از پایان دهة اول 21 کمتر فعالیت آموزشی و پژوهشی بدون استفاده از اینترنت و ارتباطات کامپیوتری صورت پذیرد. (chronicle of Higher Education, 2001)

مراکز آموزش عالی اغاز مسیر استفاده از اشکال مختلف فناوری اطلاعات برای بهبود آموزش، پژوهش و خدمات اجتماعی را طراحی می‌کنند و این ابزار به عنوان منبع قوی وارد آموزش عالی شده است. (Szatmary, 2000)

در عصر حاضر شکاف شمال و جنوب ناشی از شکاف علمی و فناوری میان این دو گروه از کشورهاست. پر کردن این فاصله محتاج رویکردی نوین و متفاوت به آموزش در سطوح مختلف و برنامه ریزی صحیح و بلندمدت با استفاده از فناوریهای نوین می‌پردازد.

مفهوم آموزش در تمام طول زندگی یکی از کلیدهای ورود به هزاره جدید است. این مفهوم به دلیل پاسخگویی به مسئله تغییر و تحول جهان و نیز به دلیل مزیت‌های انعطاف پذیری و تنوع و قابل دسترس بودن، خود مفهومی ضروری است. به علاوه این مفهوم از تمایز سنتی آن میان آموزش اولیه مدرسه‌ای و آموزش پیوسته پا را فراتر می‌گذارد. (ادگارفورد، 1972) بنابراین آموزش مداوم و مادام العمر می‌تواند از نخستین راهبردهایی باشد که مورد توجه تصمیم سازان آموزش به ویژه فنی و حرفه‌ای و عالی قرار گیرد. قابلیت انعطاف دانشگاه‌ها و متعاقب آن دانش آموختگان و آمادگی برای فراگیری و همگامی با فناوریهای نوین باید سرلوحه برنامه‌ریزان آموزشی آینده باشد. چه بسا دانشگاه‌هایی که آموزش پایه‌ای خوبی را ارائه دهند. اما اگر این آموزش در قالبی خشک و منجمد ارائه شود، نمی‌تواند آموزش صحیح و اصولی در قرن حاضر محسوب شود. و این اصل صرفا شامل حاصل اساتید و دانشجویان نخواهد شد بلکه دانش آموختگان نیز باید بتوانند قابلیت انعطاف را در خود فراهم آورند تا بتوانند در عرصه رقابت‌های حرفه‌ای و عملی باقی بمانند.

امروزه هیچ کس نمی‌تواند منکر اهمیت آموزش و مهارت‌ آموزی شود و پس از جنگ جهانی دوم تقریبا اکثریت نظام‌های آموزشی به این اهمیت پی برده‌اند. وانگهی امروزه ما در سیاره‌ای زندگی می‌کنیم که ساکنان آن ارتباط گسترده‌ای با یکدیگر دارند و تداوم پیشرفت فناوری موجب ایجاد تحولات نوینی در این مناسبات خواهد شد و به عصری گام نهاده‌ایم که دانش و مدیریت دانش نقش عمده‌ای در زندگی هر یک از ما ایفا می‌کند.

 
کلیات
1-1- فناوری اطلاعات و پردازش اطلاعات در ذهن
1-2- فن آوری اطلاعات و آموزش
1-3- مروری بر آموزش الکترونیکی
1-6- نسل‌های تکنولوژی اطلاعات
1-7- مفهوم تکنولوژی آموزشی و ابعاد آن
1-8- اثر بخشی تکنولوژی در آموزش
1-9- کامپیوتر در خدمت آموزش
1-10- فناوری آموزشی به کدام سو حرکت می‌کند؟
1-11- گرایشهای نوین در فنآوری آموزشی
1-12- تحول نحوة آموزش و یادگیری
1-13- تغییر وظیفه و کار معلم
1-14- کار گروهی و از بین رفتن موانع روانی تعلیم گیرندگان
1-15- کامپیوتر، استاد همیشه در دسترس
1-16- مراحل فناوری در محیط آموزشی
1-16-1- فناوری توزیعی (Distribution technology)
1-16-2- فناوری تعاملی (Interactive technology)
1-16-3- فناوری اشتراکی (collaborative technology)
2-2- روش پژوهش در علم و تکنولوژی آموزشی
2-3- تکنولوژی آموزشی، رویکردی مؤثر در رشد و توسعه اقتصادی، اجتماعی و صنعتی
2-4- تکنولوژی آموزشی ، رویکردی مؤثر در توسعه کمی و کیفی نظام آموزشی عالی
2-5- ارزشیابی و تجدید نظر در نظام آموزش عالی با تکیه بر کاربرد علوم و تکنولوژی‌ آموزشی
2-6- همکاریهای‌ بین المللی و منطقه‌ای
2-7- تکنولوژی آموزشی، چارچوبی مؤثر در توسعه یادگیری و بهبود آموزش
2-8- تکنولوژی آموزشی، نیروی محرکه فرآیند توسعه آموزشی
2-9- جهان گرایی تکنولوژی آموزشی
2-10-1 - رویکرد سنتی (فناوری اطلاعات به مثابه تکنولوژی آموزشی)
2-10-2- رویکردهای نوین
3-2- رئوس کار سیستم آموزشی جوامع
3-3- نیازهای اساسی آموزشی
3-4- آموزش باز
3-5- آموزش از راه دور و شکل گیری دانشگاه مجازی
3-6- آموزش از راه دور ، فرصت‌ها و چشم اندازها
3-7- دلایل نیاز به آموزش الکترونیکی
3-9- فلسفه‌های آموزش
3-11- آموزش مجازی
3-12- انواع آموزشهای وب – محور
3-12-1- مکاتبه غیر همزمان
3-12-2- مکاتبه همزمان
3-12-3- کلاس‌های برتر وب
3-12-4- کلاس‌های تحت مدیریت وب
3-12-5- توزیع دو جانبه
3-13- طبقه بندی پنج گانه آموزش وب – محور
3-14- ضرورت ایجاد آموزشهای الکترونیکی (مجازی)
3-15- سرویس‌های آموزش الکترونیکی
3-15-1- آموزش الکترونیکی برای آموزشهای شغلی
3-15-2- آموزش الکترونیکی در سطح دانشگاه‌ها
3-15-2-1- دانشگاه‌هایی که فقط دارای سرویس آموزش از راه دور اینترنت می‌باشند:
3-15-2-2- دانشگاه‌های سنتی به همراه دانشگاه‌های اینترنتی
3-15-2-3- سیستم‌های آموزش از راه دور با همکاری دانشگاه‌های مختلف
3-15-3- آموزش الکترونیکی برای جستجو کنندگان کار
3-15-4- آموزش الکترونیکی برای عموم
3-15-5- آموزش الکترونیکی جهت ایجاد ارتباط بین کشورها
3-16- روش‌ها و ابزارهای آموزش الکترونیکی
3-16-1- تلویزیون آموزشی
3-16-2- ویدئو کنفرانس تعاملی
3-16-3- آموزش مبتنی بر اینترنت
3-16-4- آموزش مبتنی بر وب WBT
3-16-4-1- WWW چیست؟ (World Wide Web)
3-17- مؤسسات آموزش از راه دور
3-17-1- مؤسسات آموزش از راه دور مستقل
3-17-2- مؤسسات مرکب (دانشکده‌های آموزش از راه دور بصورت سازمان‌های غیر رسمی):
3-18-تمهیدات‌لازم‌برای استفاده از آموزش از راه دور آغاز هزاره سوم
3-18-1- آمادگی دانشجویان
3-18-2- آمادگی نظام آموزشی
3-18-3- آمادگی مؤسسه آموزشی
3-19- رسانه‌ها و مواد آموزشی در آموزش از راه دور
رسانه‌های مورد استفاده در آموزش از راه دور
3-21-2- استادان
3-21-3- کاربران و استادان
3-21-4- مدیران
4-2- تاریخچه دانشگاه مجازی
4-3- انواع دانشگاه مجازی
4-4- خصوصیات دانشگاه مجازی
4-4-1- لایه سازمانی
4-4-2- صدور حق تکثیر
4-4-3- تضمین کیفیت
4-4-4- لایه زیرساختاری
4-5- صحن دانشگاه مجازی
4-6- ثبت نام و پرداخت شهریه
4-8-2- مزایا برای مربیان
4-8-3- مزایا برای مؤسسات آموزشی
5-2- سودها برای مصرف کننده‌ها
5-3- چگونه محتوای آموزشی الکترونیک در سازمان شما توسعه می‌یابد؟
5-4- چگونه سازمان شما خدمات آموزش الکترونیک را ارائه می‌دهد؟
5-5- سازمان شما چگونه میزان موفقیت آموزش الکترونیک را اندازه می‌گیرد؟
دعوت اصلی
حول این سه فاکتور چهار عنصر مکمل متمرکز هستند:

 

شامل 206 صفحه فایل word


دانلود با لینک مستقیم


دانلود مقاله پردازش اطلاعات در ذهن

امکان سنجی استفاده از پردازش تصویر جهت شناسایی خرابی های ظاهری خرمای مضافتی

اختصاصی از هایدی امکان سنجی استفاده از پردازش تصویر جهت شناسایی خرابی های ظاهری خرمای مضافتی دانلود با لینک مستقیم و پر سرعت .

امکان سنجی استفاده از پردازش تصویر جهت شناسایی خرابی های ظاهری خرمای مضافتی


امکان سنجی استفاده از پردازش تصویر جهت شناسایی خرابی های ظاهری خرمای مضافتی نویسند‌گان: حجت رحمانی ، سیدناصر علوی نایینی ، حسین نظام آبادی پور ، عادل احمدی
خلاصه مقاله:
سیستمهای ماشین بینایی و پردازش تصویر روشهای نوینی هستند که در بخش کشاورزی کاربردهای مختلفی دارند. در این تحقیق طبقهبندی خودکار رطب مضافتی منطقه جیرفت به چهار دسته سالم چروکیده کپکزده و همچنینصدمهدیده و له شده بر مبنای سیستم پردازش تصویر، پیشنهاد شده است. ابتدا از تعداد 90 خرما که توسط افرد خبره در چهار دسته فوقالذکر طبقهبندی شده بود، تصاویری در راستای طولی تهیه شد. با استفاده از روشهایپردازش تصویر در محیط برنامهنویسی متلب تصویر خرما از زمینه جدا گردید. همچنین الگوریتمهای مختلفی برای بازشناسی نواحی معیوب خرما پیشنهاد شد. بعد از شناخت مناسبترین روش، خرماها نسبت به درصد هر نوعخرابی و با تهیه یک الگوریتم دستهبندی، در یکی از چهار گروه مذکور قرار داده شدند. الگوریتم مذکور روی تصاویر 211 عدد خرما اجرا شد. نرخ بازشناسی درست روش پیشنهادی برای خرمای سالم، چروکیده، صدمهدیده وکپکزده به ترتیب 94/11 و88/89 و89/48 و88/09 بدست آمد.
کلمات کلیدی: خرمای مضافتی، پردازش تصویر، ماشین بینایی، خرابیهای خرما

دانلود با لینک مستقیم


امکان سنجی استفاده از پردازش تصویر جهت شناسایی خرابی های ظاهری خرمای مضافتی

پایان نامه پردازش ابری و چالش‌های امنیتی در پردازش ابری

اختصاصی از هایدی پایان نامه پردازش ابری و چالش‌های امنیتی در پردازش ابری دانلود با لینک مستقیم و پر سرعت .
پایان نامه پردازش ابری و چالش‌های امنیتی در پردازش ابری
پردازش ابری و چالش‌های امنیتی در پردازش ابری
 
بخشی از متن:
"پردازش ابری" یا "پردازش انبوه" یک تکنولوژی جدید است که به تازگی از طرف شرکت‌های مختلفی از جمله مایکروسافت، گوگل، آمازون، آی بی ام و غیره عرضه شده است. در این سیستم به جای نصب چندین نرم‌افزار بر روی چندین کامپیوتر، تنها یک نرم‌افزار، یک بار اجرا و بارگذاری می‌شود و تمامی افراد از طریق یک سرویس آنلاین به آن دسترسی پیدا می‌کنند. به این پروسه "پردازش ابری" یا در اصطلاح انگلیسی Cloud Computing می‌گویند.
پردازش ابری (به انگلیسی: Cloud Computing ) به معنی توسعه و به‌کارگیری فناوری کامپیوتر بر مبنای اینترنت است. این عبارت شیوه‌هایی از محاسبات کامپیوتری در فضایی است که قابلیت‌های مرتبط با فناوری اطلاعات به عنوان سرویس یا خدمات برای کاربر عرضه می‌شود و به او امکان می‌دهد به سرویس‌های مبتنی بر فناوری در اینترنت دسترسی داشت باشد، بدون آن‌که اطلاعات تخصصی در مورد این فناوری‌ها داشته باشد و یا بخواهد کنترل زیر ساخت‌های فناوری که از آن‌ها پشتیبانی می‌کند را در دست بگیرد. سرویس‌های پردازش ابری برنامه‌های کاربردی را به صورت برخط فراهم می‌کنند که قابل دسترسی با مرورگر وب هستند درحالی‌که نرم‌افزار و داده روی سرورها ذخیره شده‌اند.
 
فهرست مطالب
فصل اول
1-1 تعریف‌های از پردازش ابری
1-2 تعریف پردازش ابری مطابق با «موسسه ملی استاندارد و فناوری» آمریکا (NIST)
1-3یک نمونه
1-4 ویژگی‌های اساسی
1-5 شکل‌های ارایه:
1-6 شکل‌های آماده‌سازی:
1-7 امنیت ابر خصوصی وعمومی
1-8 اثرات Self Service و تاثیر آن بر امنیت:
1-9 چالش‌های امنیتی و تأثیر آن بر رایانش ابری
1-10 انواع سرویسها در ابر به سه دسته تقسیم می‌شوند:
1-11 از جمله مزایایی که میتوان برای رایانش ابری برشمرد،
1-12 علاوه بر داشتن مزایا، رایانش ابری دارای معایبی مانند
به کارگیری تکنولوژی مجازی سازی در رایانش ابری
2-1 انواع مجازی سازی ماشین مجازی:
2-1-1 مجازی سازی نوع اول
2-1-2 مجازی سازی نوع دوم
2-2 انواع آسیب پذیری‌های محیط مجازی
فصل سوم
تهدیدات امنیتی موجود در رایانش ابری و راه حل کاهش آنها
3-1 تهدیدات داخلی
2-3 تهدیدات خارجی
3-3 کنترل دسترسی
3-4 وقفه در سرویس‌دهی
3-5 چند مستاجری
3-6  قابلیت حمل
3-7 انتقال اطلاعات
3-8  API ‌های ناامن
3-9  رابط مدیریت دسترسی از راه دور
4. مقایسه و ارزیابی تاثیر چالشهای امنیتی بر مزایای رایانش ابری
محاسبات ابری
دیدگاه های مختلف در خصوص محاسبات ابری
طرفداران ابر روی 5 مزیت کلیدی تکیه می‌کنند:
شناخت بهتر محاسبات ابری
محاسبات جادویی یا Magic Computing
پروژکتور پوشیدنیOmniTouch:
مزایا و نقاط قوت Cloud Computing
هزینه‌های کامپیوتری کم تر
کارآیی توسعه یافته
هزینه‌های نرم‌افزاری کم تر
ارتقای نرم‌افزاری سریع و دائم
سازگاری بیشتر فرمت اسناد
ظرفیت نامحدود ذخیره سازی
دسترسی جهانی به اسناد
در اختیار داشتن آخرین و جدیدترین نسخه
همکاری گروهی ساده تر
مستقل از سخت افزار
نقاط ضعف Cloud Computing
نیاز به اتصال دائمی به اینترنت دارد
با اتصال‌های اینترنتی کم سرعت کار نمی‌کند
می تواند کند باشد
ویژگی‌ها ممکن است محدود باشند
داده‌های ذخیره شده ممکن است از امنیت کافی برخوردار نباشند.
چه کسانی می‌توانند از مزایای Cloud Computing بهره مند شوند؟
چه کسانی باید از Cloud Computing استفاده کنند؟
کاربرانی با نیازهای روزافزون
چه کسانی نباید از Cloud Computing استفاده کنند؟
فناوری محاسبات ابری و نگرش‌های گوناگون
ویندوز 8 و محاسبات ابری
چاپ ابری گوگل چیست ؟
چگونه پرینتر خود را در اینترنت به اشتراک بگذارم ؟
به اشتراک گداری چاپگر خود با دوستان :
دوستان من چگونه می‌توانند از چاپگر من استفاده کنند ؟
تفاوت رایانش ابری با رایانش مشبک
ده واقعیت اساسی درباره رایانش ابری

دانلود با لینک مستقیم


پایان نامه پردازش ابری و چالش‌های امنیتی در پردازش ابری

ابزارهای لازم برای پردازش متن در زبان فارسی - متن کاوی

اختصاصی از هایدی ابزارهای لازم برای پردازش متن در زبان فارسی - متن کاوی دانلود با لینک مستقیم و پر سرعت .

ابزارهای لازم برای پردازش متن در زبان فارسی

تشخیص دهنده ی جمله: این ابزار باید با توجه به کاراکترهای جداکننده ی جمله در زبان فارسی، توانایی تشخیص جملات را در متن ورودی داشته باشد. برای ایجاد این ابزار باید ابتدا تمامی کاراکترها، نماد ها و احیاناً قواعد دستوری که باعث شکسته شدن جملات می شوند، شناسایی گردند. با توجه به پایه بودن جمله در بسیاری از پردازش های زبانی، خروجی دقیق این ابزار از درجه ی اهمیت بالایی برخوردار است. از نمونه های انگلیسی آن می توان به OpenNLP، Stanford NLP، NLTK و Freeling اشاره کرد.

Tokenizer: ابزاری برای شکستن یک متن بر اساس واحدهای با معنی مانند کلمه، پاراگراف، نمادهای معنادار مانند space و  tab و … . لازمه ی ایجاد این ابزار جمع آوری واحد هایی است که در زبان فارسی به عنوان واحد های مستقل معنایی شناخته می شوند. سپس بر اساس انتخاب هر کدام از این واحدها متن بر اساس آن شکسته خواهد شد. از نمونه های انگلیسی آن می توان به Flex، JLex، JFLex، ANTLR، Ragel و Quex اشاره کرد.

Named entity recognition: ابزاری برای تشخیص اسامی و نوع آنها اعم از اسامی افراد، اماکن، مقادیر عددی و … . برای تشخیص اینکه یک کلمه اسم است، راه های مختلفی وجود دارد که از جمله ی آنها مراجعه به لغتنامه، مراجعه به word-net، در نظر گرفتن ریشه ی کلمه، استفاده از قواعد نحوی ساخت واژه و … می باشد. در این ابزار پس از تشخیص اسم ها با استفاده یک لغتنامه از اسامی افراد، مکان ها، مقادیر عددی و … نوع اسم تشخیص داده می شود. به نظر می رسد که این لغتنامه در فارسی موجود نمی باشد.

از جمله نمونه های انگلیسی این ابزار می توان به Stanford NER و Illinois NER اشاره کرد.

Word-net: مجموعه ای از لغات و ارتباط میان آنها به لحاظ معنایی. ارتباطات معنایی در داخل این مجموعه شامل ۱۶  رابطه  می باشد. این مجموعه به عنوان یک مرجع در بسیاری از پردازش های زبانی مورد استفاده قرار می گیرد. ار نمونه های انگلیسی آن می توان به Princeton Wordnet و EuroWordnet اشاره کرد. آزمایشگاه فناوری وب دانشگاه فردوسی مشهد نیز یک نمونه از این مجموعه با نام فردوس نت را تولید کرده است.

Stemmer: ابزاری برای ریشه یابی لغات و تشخیص نوع کلمه ساخته شده از آن ریشه (اسم مکان، اسم زمان، حالت فاعلی، مفعولی و …). معمولاً ریشه یابی لغات بر اساس قواعد ساخت واژه ای و سپس حذف پسوندها می باشد. تاکنون روش مؤثری برای حذف پیشوندها ارائه نشده است. در تلاشی که در آزمایشگاه فناوری وب انجام شده است، سعی شده تا بر اساس آنالیزهای آماری و داده کاوی پسوندها حذف گردند، که این روش هم می تواند راهی برای تشخیص ریشه باشد.

معروفترین الگوریتم ریشه یابی در انگلیسی porter می باشد.

Similarity recognition: ابزاری برای تشخیص میزان شباهت میان دو عبارت بر اساس پارامترهای مختلف مانند نوع اسامی مشابه به کار رفته، استفاده از word-net و… . در این ابزار پس از تشخیص نوع کلمات به کار رفته در یک جمله و سپس بر اساس جایگاه آن کلمات در جمله، کلماتی که در جایگاه های یکسان قرار دارند، مورد مقایسه قرار می گیرند. از نمونه های انگلیسی آن می توان به Illinois NESim و Illinois WNSim اشاره نمود.

Chunker: ابزاری برای تشخیص گروه های اسمی، فعلی و …. در یک جمله. جهت تقویت الگوریتم های وابسته به SRL لازم است نه تنها نقش های کلمات مشخص گردند، بلکه باید وابستگی های کلمات به لحاظ نقشی در جمله مشخص گردند. از جمله نمونه های انگلیسی آن می توان به Illinois Chunker  اشاره کرد.

Semantic role labeler: ابزاری برای تشخیص نقش گرامری کلمه در جمله. این ابزار یکی از مهمترین نقش ها را در پردازش های زبانی بر عهده دارد. دقت در این ابزار بسیار حائز اهمیت است. این ابزار باید نقش های گرامری کلمات در جمله ها مانند فعل، فاعل، مفعول مستقیم، مفعول غیر مستقیم و …. را تشخیص دهد. از جمله نمونه های انگلیسی آن می توان به OpenNlP، Illinois SRL، Swirl و LTHSRL  اشاره کرد. این ابزارها از الگوریتم پارسینگ charniak استفاده می کنند.

Annotator: ابزاری برای ایجاد یک نمونه از یک آنتولوژی در یک سند داده شده. از ابزارهای موجود در انگلیسی می توان به Illinois Curator و Stanford Annotator اشاره کرد.

Coreference resolution: ابزاری برای تعیین مرجع اسمی یک اسم یا یک ضمیر در جملات. این ابزار در زبان انگلیسی معادل ابزاری است که مرجع ضمیر را که به صورت اسم در جمله های قبلی آمده است، مشخص می کند. استفاده از ضمایر به جای اسامی در زبان انگلیسی بسیر رایج می باشد. اما در زبان فارسی این امر چندان رایج نیست. اما در زبان فارسی عنوان یک مفهوم اسمی با اصطلاحات مختلف بسیار رایج می باشد. عملاً ما به دنبال ابزاری هستیم که مرجع خاص یک سری از عنوان ها ی مختلف اسمی را مشخص کند. از نمونه های انگلیسی این ابزار می توان به Illinois Coreference package  اشاره کرد.

Pos tagger: ابزاری برای مشخص کردن نوع کلمات از قبیل اسم، صفت، قید، فعل و … . یکی از روش های کاری برای ایجاد این ابزار، ایجاد یک rule base که معمولاً به صورت دستی تشکلیل می شود، برای تشخیص نوع کلمه است. از نونه های فارسی آن می توان به ابزار آزمایشگاه آقای دکتر بیجن خان، و ابزار آزمایشگاه فناوری وب دانشگاه فردوسی مشهد اشاره کرد. از نمونه های انگلیسی آن می توان به Illinois Part Of Speech Tagger و Stanford POS Tagger اشاره کرد.

————————————————————————-

نرمالسازی متن

در ابتدا بایستی همه‌ی نویسه‌های (کاراکترهای) متن با جایگزینی با معادل استاندارد آن، یکسان‌سازی گردند. در اولین گام باید متون برای استفاده در گام‌های بعدی به شکلی استاندارد درآیند. از آنجایی که متون مختلف ممکن است بسیار به هم شبیه باشند اما به دلیل تفاوت‌های ساده ظاهری از نظر ماشین متفاوت باشند؛ به همین دلیل سعی شده است این تفاوت­های ساده‌ی ظاهری برطرف گردد. همچنین اصلاحات دیگری نیز به منظور پردازش دقیق­تر متون در این مرحله صورت می­گیرد.

در اولین گام باید متون برای استفاده در گام­های بعدی به شکلی استاندارد درآیند. از آنجایی که متون مختلف ممکن است بسیار به هم شبیه باشند اما به دلیل تفاوت‌های ساده ظاهری از نظرماشین متفاوت باشند؛ به همین دلیل سعی شده است این تفاوت‌های ساده­ی ظاهری برطرف گردد. برای رسیدن به این هدف، قبل از مقایسه متون، پیش‌پردازش‌هایی روی آنها آنجام می‌شود. طبیعتا هر چه این پیش‌پردازش‌ها قوی‌تر باشد، نتایج حاصل ازمقایسه متون قابل اطمینان­تر خواهد بود. لازم به ذکر است که از آن جایی که زبان فارسی جزو زبان‌های غیر ساختیافته است با مشکلات بسیار بیشتری نسبت به سایر زبان‌ها مواجه خواهیم شد. متون غیرساخت‌یافته، متونی هستند که پیش فرض خاصی در مورد قالب آنها نداریم و آنها را به صورت مجموعه‌ای مرتب از جملات در نظر می‌گیریم.

در ابتدا بایستی همه­ی نویسه‌های (کاراکترهای) متن با جایگزینی با معادل استاندارد آن یکسان­سازی گردند. در پردازش رسم الخط زبان فارسی، با توجه به قرابتی که با رسم الخط عربی دارد، همواره در تعدادی از حرف­ها مشکل وجود دارد که از جمله آن­ها می­توان به حروف “ک”، “ی”، همزه و … اشاره نمود. در اولین گام باید مشکلات مربوط به این حروف را برطرف ساخت. علاوه بر این، اصلاح و یکسان سازی نویسه‌ی نیم‌فاصله و فاصله در کاربردهای مختلف آن و همچنین حذف نویسه­ی «ـ» که برای کشش نویسه­های چسبان مورد استفاده قرار می­گیرد و مواردی مشابه برای یکسان­سازی متون، از اقدامات لازم قبل از شروع فاز‌های مختلف می­باشد. در این فاز مطابق با یک سری قاعده دقیق و مشخص، فاصله­ها و نیم­فاصله­های موجود در متن برای علاماتی نظیر “ها” و “ی” غیرچسبان در انتهای لغات و همچنین پیشوندها و پسوندهای فعل­ساز نظیر “می”، “ام”، “ایم”، “اید” و موارد مشابه جهت استفاده در فازهای بعدی، اصلاح می­گردند. در ادامه به چند نمونه از این اصلاحات، اشاره شده است.

با استفاده از این ویژگی نرم‌افزار می‌توان همه­ی نویسه‌های (کاراکترهای) متن را استاندارد نمود. اگر نویسه‌ی غیر استانداردی یافت شد، با معادل استاندارد آن جایگزین می‌شود. برخی از این اصلاحات در ذیل آورده شده است:

  • اصلاح انواع حرف «ک» به معادل فارسی آنان.
  • اصلاح انواع حرف «ی» به معادل فارسی آنان.
  • بررسی همزه و انواع مختلف املاهای موجود و اصلاح هر کدام (به عنوان مثال تبدیل ؤ به و ، ئ به ی ، أ به ا ، إ به ا و…)
  • حذف شناسه‌ی همزه از انتهای واژه‌هایی مثل شهداء
  • حذف شناسه «آ» به «ا» مانند: آب به اب
  • اصلاح نویسه‌ی «طور» در واژه‌هایی مانند به طور، آن طور، این طور و …
  • بررسی وجود حرف «ی» در انتهای لغاتی مانند خانه‌ی ما و اصلاح آنان
  • حذف تشدید از واژه‌ها
  • تبدیل ارقام عربی و انگلیسی به معادل فارسی.
  • اصلاح نویسه‌ی نیم‌فاصله
  • اصلاح اعراب و حذف فتحه، کسره و ضمه و همچنین تنوین‌ها
  • حذف نیم‌فاصله‌های تکراری
  • حذف نویسه‌ی «ـ» که برای کشش نویسه­های چسبان مورد استفاده قرار می­گیرد. مانند تبدیل«بــــــــر» و «بـــر» به «بر»
  • چسباندن پسوندهای «تر»، «ترین» و … به آخر واژه‌ها
  • اصلاح فاصله‌گذاری «ها» در انتهای واژه‌ها و همچنین پسوندهای «های»، «هایی»، «هایم»، «هایت»، «هایش» و …
  • اصلاح فاصله‌گذاری «می»، «نمی»، «درمی»، «برمی»، «بی» در ابتدای واژه‌ها
  • تبدیل «‍ة» به «‍ه‌ی»
  • تبدیل «ب» متصل به ابتدای واژه‌ها به «به»
  • اصلاح فاصله‌گذاری پسوندها
  • حذف فاصله‌ها و نیم‌فاصله‌های اضافه بکار رفته در متن
  • تصحیح فاصله‌گذاری در مورد علائم سجاوندی بدین صورت که علائم سجاوندی به لغات قبل از خود می‌چسبند و با لغت بعد از خود فاصله خواهند داشت.

برای اعمال اصلاحات اولیه قبل از هر عملیاتی، بایستی متون مورد پردازش توسط ابزار Normalizer طراحی شده، مورد اصلاح قرار گیرند.

——————————————————————–

ریشه‌یابی معنایی در زبان فارسی

هدف از انجام  پروژه ریشه یابی معنایی در زبان فارسی، جداسازی کلمات از متن و بازگرداندن کلمات به ریشه اصلی تشکیل دهنده آنهاست. تفاوت اصلی این پروژه با سایر پژوهش‌های انجام شده در زمینه ریشه‌یابی، قابلیت بازگرداندن کلمات به ریشه بدون از بین رفتن معنای آنها در جمله می‌باشد. بدین منظور به نقش کلمات در جمله توجه ویژه‌ای شده است. در این طرح از مجموعه افعال گرداوری شده توسط گروه دادگان و لغات پرکاربرد پیکره همشهری استفاده شده است.

 ——————————————————————– 

برچسب گذار نقش کلمات فارسی

برچسب گذاری اجزای واژگانی کلام (Part of Speech tagging) عمل انتساب برچسب های واژگانی به کلمات و نشانه های تشکیل دهنده یک متن است؛ به صورتی که این برچسب ها نشان دهنده نقش کلمات و نشانه ها در جمله باشد. درصد بالایی از کلمات از نقطه نظر برچسب واژگانی دارای ابهام هستند، زیرا کلمات در جایگاههای مختلف برچسب های واژگنی متفاوتی دارند. بنابراین برچسب گذاری واژگانی عمل ابهام زدایی از برچسب ها با توجه به زمینه (متن) مورد نظر است. برچسب گذاری واژگانی عملی اساسی برای بسیاری از حوزه های دیگر پردازش زبان طبیعی(NLP) از قبیل ترجمه ماشینی، خطایاب و تبدیل متن به گفتار می باشد. تا کنون مدل ها و روش های زیادی برای برچسب گذاری در زبان های مختلف استفاده شده است. بعضی از این روش ها عبارتند از:

  •   مدل مخفی مارکوف (Markov Hidden Model)
  •   برچسب گذاری مبتنی بر تبدیل یا قانون (Transformation/Rule -based tagger)
  •   سیستم های مبتنی بر حافظه (Memory-basedSystem
  •   سیستم های ماکزیمم آنتروپی (Maximum Entropy System)

——————————————————————–

پارسر زبان فارسی

به موازات پیشرفت و تحولات نظری در زبان‌شناسی جدید، روش‌های تحلیل متون و دستورات زبان بوسیلهی رایانه نیز تحول یافته است. منظور از گرامر هر زبان، در دست داشتن یک سری دستورات زبانی قابل فهم برای رایانه است که به کمک آنها بتوان اجزای نحوی یک جمله را به طور صحیح تفکیک نمود. تجزیه و تحلیل جمله و شکستن آن به اجزای تشکیل دهنده مانند گروه های اسمی، فعلی، قیدی و غیره توسط ابزاری به نام پارسر صورت می گیرد که نقش اساسی در طراحی و یا افزایش دقت سایر ابزارهای پردازش متن دارد.

پارسر طراحی شده برای زبان فارسی در این پروژه، از ساختار لغات، موقعیت و ترتیب لغات در جمله، حروف یا عبارات قبل و بعد از آنها و نوع لغات، درخت نحوی یا پارسینگ را برای جملات متن تشکیل می دهد. در واقع عملیات پارسینگ با توجه به ریختشناسی (مطالعه ساختار و حالتهای مختلف یک کلمه) و همچنین دستورات نحوی گرامر زبان فارسی صورت میگیرد. بدیهی است هر چقدر نگارش بکار رفته در جملات و همچنین رعایت علائم سجاوندی طبق اصول و با دقت بیشتری صورت گرفته باشد، عملیات پارسینگ با کیفیت بهتری صورت خواهد گرفت و اجزای تشکیل دهنده ی جمله با عملیات کمتر و ساده تری برچسب زده خواهند شد.

 

یک فایل فشرده حاوی  فایل EXE (شامل ابزارهای پیش پردازش متون زبان فارسی : نرمالسازی – ریشه یابی – برچسب زنی نحوی – پارسر )

 

کد سی شارپ همراه با کتابخانه های مورد نیاز جهت ریشه یابی کلمات فارسی:

در این نمونه کد، که به زبان سی شارپ نوشته شده است، کتابخانه های لازم برای استفاده از کد ریشه یاب زبان فارسی که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد تولید شده است، به کد اضافه شده و چگونگی استفاده از این کتابخانه ها در کد مشخص است و در قالب ابزاری جهت دادن ورودی و مشاهده خروجی آماده شده است.

در کد موجود در فایل ضمیمه سه کتابخانه (فایل dll) اضافه شده اند که امکان شناسایی افعال و ریشه یابی کلمات را فراهم می آورند…

 

برای استفاده از نرم افزار در صورت اجرا نشدم برنامه در فایل EXE، ابتدا بسته نرم افزاری دات نت فریمورک ۴.۵ را نصب نمایید.

 

 

برای دانلود با تخفیف ویژه اینجا کلیک کنید


دانلود با لینک مستقیم


ابزارهای لازم برای پردازش متن در زبان فارسی - متن کاوی