برچسب کاوی - هایدی

دانلود مقاله با موضوع نگاهی بر داده کاوی و کشف قوانین وابستگی

اختصاصی از هایدی دانلود مقاله با موضوع نگاهی بر داده کاوی و کشف قوانین وابستگی دانلود با لینک مستقیم و پر سرعت .

فرمت فایل : word

نعداد صفحات :22

قابل ویرایش

چکیده:

با افزایش سیستمهای کامپیوتر و گسترش تکنولوژی اطلاعات , بحث اصلی در علم کامپیوتر از چگونگی جمع آوری اطلاعات به نحوه استفاده از اطلاعات منتقل شده است . سیستمهای داده کاوی ,این امکان را به کاربر می دهند که بتواند انبوه داده های جمع آوری شده را تفسیر کنند و دانش نهفته در آن را استخراج نمایند .
داده کاوی به هر نوع کشف دانش و یا الگوی پنهان در پایگاه داده ها اطلاق می شود . امروزه داده کاوی به عنوان یکی از مهمترین مسائل هوش مصنوعی و پایگاه داده ، محققان بسیاری را به خود جذب کرده است . در این تحقیق ابتدا نگاه کلی بر داده کاوی ، استراتژیهای داده کاوی و... داریم ، سپس مسأله کشف قوانین وابستگی در پایگاه داده را به تفضیل بررسی کردیم و نگاهی به الگوریتمهای موجود برای آن داشتیم . سپس مسأله کشف قوانین وابستگی در پایگاه داده های پویا را مورد بحث قرار دادیم و الگوریتم های ارائه شده مربوطه را مطرح کردیم .

فهرست مطالب:

چکیده
مقدمه
تعریف
کشف دانش در پایگاه داده
آیا داده کاوی برای حل مسائل ما مناسب است؟
جمع آوری داده ها
داده کاوی
تفسیر نتایج
بکارگیری نتایج
استراتژیهای داده کاوی
طبقه بندی
تخمین
پیش گویی Perdiction
Unsupervised Clustering دسته بندی بدون کنترل
تحلیل سبد بازاری Market Basket Analyse
Supervised Data Mining تکنیکهای داده کاوی تحت کنترل
شبکه عصبی
برگشت آماری1
قوانین وابستگی2
Apriori الگوریتم
الگوریتم : Aprior TID
الگوریتم partition
الگوریتم های MaxEclat,Eclat
الگوریتم با ساختار trie
الگوریتم fp-grow
ساخت fp- tree
الگوریتم ساخت fp- tree
الگوی شرطی
Fp-tree شرطی
الگوریتم برداری
الگوریتم ارائه شده
یک الگوریتم جدید برای پایگاه داده های پویا
نگهداری قوانین وابستگی
الگوریتم کاهشی
نتیجه گیری
مراجع

دانلود با لینک مستقیم

دانلود مقاله با موضوع نگاهی بر داده کاوی و کشف قوانین وابستگی

دانلود مقاله موضوع نگاهی داده کاوی کشف قوانین وابستگی داده کاوی

yarafile جمعه 21 خرداد 1395 ساعت 16:53

0 نظر

داده کاوی با استفاده از اتوماتای یادگیر

اختصاصی از هایدی داده کاوی با استفاده از اتوماتای یادگیر دانلود با لینک مستقیم و پر سرعت .

دانلود با لینک مستقیم

داده کاوی با استفاده از اتوماتای یادگیر

داده کاوی استفاده اتوماتای یادگیر پروژه پایان نامه فیلم

yarafile پنج‌شنبه 20 خرداد 1395 ساعت 12:48

0 نظر

ابزارهای لازم برای پردازش متن در زبان فارسی - متن کاوی

اختصاصی از هایدی ابزارهای لازم برای پردازش متن در زبان فارسی - متن کاوی دانلود با لینک مستقیم و پر سرعت .

ابزارهای لازم برای پردازش متن در زبان فارسی

تشخیص دهنده ی جمله: این ابزار باید با توجه به کاراکترهای جداکننده ی جمله در زبان فارسی، توانایی تشخیص جملات را در متن ورودی داشته باشد. برای ایجاد این ابزار باید ابتدا تمامی کاراکترها، نماد ها و احیاناً قواعد دستوری که باعث شکسته شدن جملات می شوند، شناسایی گردند. با توجه به پایه بودن جمله در بسیاری از پردازش های زبانی، خروجی دقیق این ابزار از درجه ی اهمیت بالایی برخوردار است. از نمونه های انگلیسی آن می توان به OpenNLP، Stanford NLP، NLTK و Freeling اشاره کرد.

Tokenizer: ابزاری برای شکستن یک متن بر اساس واحدهای با معنی مانند کلمه، پاراگراف، نمادهای معنادار مانند space و tab و … . لازمه ی ایجاد این ابزار جمع آوری واحد هایی است که در زبان فارسی به عنوان واحد های مستقل معنایی شناخته می شوند. سپس بر اساس انتخاب هر کدام از این واحدها متن بر اساس آن شکسته خواهد شد. از نمونه های انگلیسی آن می توان به Flex، JLex، JFLex، ANTLR، Ragel و Quex اشاره کرد.

Named entity recognition: ابزاری برای تشخیص اسامی و نوع آنها اعم از اسامی افراد، اماکن، مقادیر عددی و … . برای تشخیص اینکه یک کلمه اسم است، راه های مختلفی وجود دارد که از جمله ی آنها مراجعه به لغتنامه، مراجعه به word-net، در نظر گرفتن ریشه ی کلمه، استفاده از قواعد نحوی ساخت واژه و … می باشد. در این ابزار پس از تشخیص اسم ها با استفاده یک لغتنامه از اسامی افراد، مکان ها، مقادیر عددی و … نوع اسم تشخیص داده می شود. به نظر می رسد که این لغتنامه در فارسی موجود نمی باشد.

از جمله نمونه های انگلیسی این ابزار می توان به Stanford NER و Illinois NER اشاره کرد.

Word-net: مجموعه ای از لغات و ارتباط میان آنها به لحاظ معنایی. ارتباطات معنایی در داخل این مجموعه شامل ۱۶ رابطه می باشد. این مجموعه به عنوان یک مرجع در بسیاری از پردازش های زبانی مورد استفاده قرار می گیرد. ار نمونه های انگلیسی آن می توان به Princeton Wordnet و EuroWordnet اشاره کرد. آزمایشگاه فناوری وب دانشگاه فردوسی مشهد نیز یک نمونه از این مجموعه با نام فردوس نت را تولید کرده است.

Stemmer: ابزاری برای ریشه یابی لغات و تشخیص نوع کلمه ساخته شده از آن ریشه (اسم مکان، اسم زمان، حالت فاعلی، مفعولی و …). معمولاً ریشه یابی لغات بر اساس قواعد ساخت واژه ای و سپس حذف پسوندها می باشد. تاکنون روش مؤثری برای حذف پیشوندها ارائه نشده است. در تلاشی که در آزمایشگاه فناوری وب انجام شده است، سعی شده تا بر اساس آنالیزهای آماری و داده کاوی پسوندها حذف گردند، که این روش هم می تواند راهی برای تشخیص ریشه باشد.

معروفترین الگوریتم ریشه یابی در انگلیسی porter می باشد.

Similarity recognition: ابزاری برای تشخیص میزان شباهت میان دو عبارت بر اساس پارامترهای مختلف مانند نوع اسامی مشابه به کار رفته، استفاده از word-net و… . در این ابزار پس از تشخیص نوع کلمات به کار رفته در یک جمله و سپس بر اساس جایگاه آن کلمات در جمله، کلماتی که در جایگاه های یکسان قرار دارند، مورد مقایسه قرار می گیرند. از نمونه های انگلیسی آن می توان به Illinois NESim و Illinois WNSim اشاره نمود.

Chunker: ابزاری برای تشخیص گروه های اسمی، فعلی و …. در یک جمله. جهت تقویت الگوریتم های وابسته به SRL لازم است نه تنها نقش های کلمات مشخص گردند، بلکه باید وابستگی های کلمات به لحاظ نقشی در جمله مشخص گردند. از جمله نمونه های انگلیسی آن می توان به Illinois Chunker اشاره کرد.

Semantic role labeler: ابزاری برای تشخیص نقش گرامری کلمه در جمله. این ابزار یکی از مهمترین نقش ها را در پردازش های زبانی بر عهده دارد. دقت در این ابزار بسیار حائز اهمیت است. این ابزار باید نقش های گرامری کلمات در جمله ها مانند فعل، فاعل، مفعول مستقیم، مفعول غیر مستقیم و …. را تشخیص دهد. از جمله نمونه های انگلیسی آن می توان به OpenNlP، Illinois SRL، Swirl و LTHSRL اشاره کرد. این ابزارها از الگوریتم پارسینگ charniak استفاده می کنند.

Annotator: ابزاری برای ایجاد یک نمونه از یک آنتولوژی در یک سند داده شده. از ابزارهای موجود در انگلیسی می توان به Illinois Curator و Stanford Annotator اشاره کرد.

Coreference resolution: ابزاری برای تعیین مرجع اسمی یک اسم یا یک ضمیر در جملات. این ابزار در زبان انگلیسی معادل ابزاری است که مرجع ضمیر را که به صورت اسم در جمله های قبلی آمده است، مشخص می کند. استفاده از ضمایر به جای اسامی در زبان انگلیسی بسیر رایج می باشد. اما در زبان فارسی این امر چندان رایج نیست. اما در زبان فارسی عنوان یک مفهوم اسمی با اصطلاحات مختلف بسیار رایج می باشد. عملاً ما به دنبال ابزاری هستیم که مرجع خاص یک سری از عنوان ها ی مختلف اسمی را مشخص کند. از نمونه های انگلیسی این ابزار می توان به Illinois Coreference package اشاره کرد.

Pos tagger: ابزاری برای مشخص کردن نوع کلمات از قبیل اسم، صفت، قید، فعل و … . یکی از روش های کاری برای ایجاد این ابزار، ایجاد یک rule base که معمولاً به صورت دستی تشکلیل می شود، برای تشخیص نوع کلمه است. از نونه های فارسی آن می توان به ابزار آزمایشگاه آقای دکتر بیجن خان، و ابزار آزمایشگاه فناوری وب دانشگاه فردوسی مشهد اشاره کرد. از نمونه های انگلیسی آن می توان به Illinois Part Of Speech Tagger و Stanford POS Tagger اشاره کرد.

————————————————————————-

نرمالسازی متن

در ابتدا بایستی همه‌ی نویسه‌های (کاراکترهای) متن با جایگزینی با معادل استاندارد آن، یکسان‌سازی گردند. در اولین گام باید متون برای استفاده در گام‌های بعدی به شکلی استاندارد درآیند. از آنجایی که متون مختلف ممکن است بسیار به هم شبیه باشند اما به دلیل تفاوت‌های ساده ظاهری از نظر ماشین متفاوت باشند؛ به همین دلیل سعی شده است این تفاوتهای ساده‌ی ظاهری برطرف گردد. همچنین اصلاحات دیگری نیز به منظور پردازش دقیقتر متون در این مرحله صورت میگیرد.

در اولین گام باید متون برای استفاده در گامهای بعدی به شکلی استاندارد درآیند. از آنجایی که متون مختلف ممکن است بسیار به هم شبیه باشند اما به دلیل تفاوت‌های ساده ظاهری از نظرماشین متفاوت باشند؛ به همین دلیل سعی شده است این تفاوت‌های سادهی ظاهری برطرف گردد. برای رسیدن به این هدف، قبل از مقایسه متون، پیش‌پردازش‌هایی روی آنها آنجام می‌شود. طبیعتا هر چه این پیش‌پردازش‌ها قوی‌تر باشد، نتایج حاصل ازمقایسه متون قابل اطمینانتر خواهد بود. لازم به ذکر است که از آن جایی که زبان فارسی جزو زبان‌های غیر ساختیافته است با مشکلات بسیار بیشتری نسبت به سایر زبان‌ها مواجه خواهیم شد. متون غیرساخت‌یافته، متونی هستند که پیش فرض خاصی در مورد قالب آنها نداریم و آنها را به صورت مجموعه‌ای مرتب از جملات در نظر می‌گیریم.

در ابتدا بایستی همهی نویسه‌های (کاراکترهای) متن با جایگزینی با معادل استاندارد آن یکسانسازی گردند. در پردازش رسم الخط زبان فارسی، با توجه به قرابتی که با رسم الخط عربی دارد، همواره در تعدادی از حرفها مشکل وجود دارد که از جمله آنها میتوان به حروف “ک”، “ی”، همزه و … اشاره نمود. در اولین گام باید مشکلات مربوط به این حروف را برطرف ساخت. علاوه بر این، اصلاح و یکسان سازی نویسه‌ی نیم‌فاصله و فاصله در کاربردهای مختلف آن و همچنین حذف نویسهی «ـ» که برای کشش نویسههای چسبان مورد استفاده قرار میگیرد و مواردی مشابه برای یکسانسازی متون، از اقدامات لازم قبل از شروع فاز‌های مختلف میباشد. در این فاز مطابق با یک سری قاعده دقیق و مشخص، فاصلهها و نیمفاصلههای موجود در متن برای علاماتی نظیر “ها” و “ی” غیرچسبان در انتهای لغات و همچنین پیشوندها و پسوندهای فعلساز نظیر “می”، “ام”، “ایم”، “اید” و موارد مشابه جهت استفاده در فازهای بعدی، اصلاح میگردند. در ادامه به چند نمونه از این اصلاحات، اشاره شده است.

با استفاده از این ویژگی نرم‌افزار می‌توان همهی نویسه‌های (کاراکترهای) متن را استاندارد نمود. اگر نویسه‌ی غیر استانداردی یافت شد، با معادل استاندارد آن جایگزین می‌شود. برخی از این اصلاحات در ذیل آورده شده است:

اصلاح انواع حرف «ک» به معادل فارسی آنان.
اصلاح انواع حرف «ی» به معادل فارسی آنان.
بررسی همزه و انواع مختلف املاهای موجود و اصلاح هر کدام (به عنوان مثال تبدیل ؤ به و ، ئ به ی ، أ به ا ، إ به ا و…)
حذف شناسه‌ی همزه از انتهای واژه‌هایی مثل شهداء
حذف شناسه «آ» به «ا» مانند: آب به اب
اصلاح نویسه‌ی «طور» در واژه‌هایی مانند به طور، آن طور، این طور و …
بررسی وجود حرف «ی» در انتهای لغاتی مانند خانه‌ی ما و اصلاح آنان
حذف تشدید از واژه‌ها
تبدیل ارقام عربی و انگلیسی به معادل فارسی.
اصلاح نویسه‌ی نیم‌فاصله
اصلاح اعراب و حذف فتحه، کسره و ضمه و همچنین تنوین‌ها
حذف نیم‌فاصله‌های تکراری
حذف نویسه‌ی «ـ» که برای کشش نویسههای چسبان مورد استفاده قرار میگیرد. مانند تبدیل«بــــــــر» و «بـــر» به «بر»
چسباندن پسوندهای «تر»، «ترین» و … به آخر واژه‌ها
اصلاح فاصله‌گذاری «ها» در انتهای واژه‌ها و همچنین پسوندهای «های»، «هایی»، «هایم»، «هایت»، «هایش» و …
اصلاح فاصله‌گذاری «می»، «نمی»، «درمی»، «برمی»، «بی» در ابتدای واژه‌ها
تبدیل «‍ة» به «‍ه‌ی»
تبدیل «ب» متصل به ابتدای واژه‌ها به «به»
اصلاح فاصله‌گذاری پسوندها
حذف فاصله‌ها و نیم‌فاصله‌های اضافه بکار رفته در متن
تصحیح فاصله‌گذاری در مورد علائم سجاوندی بدین صورت که علائم سجاوندی به لغات قبل از خود می‌چسبند و با لغت بعد از خود فاصله خواهند داشت.

برای اعمال اصلاحات اولیه قبل از هر عملیاتی، بایستی متون مورد پردازش توسط ابزار Normalizer طراحی شده، مورد اصلاح قرار گیرند.

——————————————————————–

ریشه‌یابی معنایی در زبان فارسی

هدف از انجام پروژه ریشه یابی معنایی در زبان فارسی، جداسازی کلمات از متن و بازگرداندن کلمات به ریشه اصلی تشکیل دهنده آنهاست. تفاوت اصلی این پروژه با سایر پژوهش‌های انجام شده در زمینه ریشه‌یابی، قابلیت بازگرداندن کلمات به ریشه بدون از بین رفتن معنای آنها در جمله می‌باشد. بدین منظور به نقش کلمات در جمله توجه ویژه‌ای شده است. در این طرح از مجموعه افعال گرداوری شده توسط گروه دادگان و لغات پرکاربرد پیکره همشهری استفاده شده است.

——————————————————————–

برچسب گذار نقش کلمات فارسی

برچسب گذاری اجزای واژگانی کلام (Part of Speech tagging) عمل انتساب برچسب های واژگانی به کلمات و نشانه های تشکیل دهنده یک متن است؛ به صورتی که این برچسب ها نشان دهنده نقش کلمات و نشانه ها در جمله باشد. درصد بالایی از کلمات از نقطه نظر برچسب واژگانی دارای ابهام هستند، زیرا کلمات در جایگاههای مختلف برچسب های واژگنی متفاوتی دارند. بنابراین برچسب گذاری واژگانی عمل ابهام زدایی از برچسب ها با توجه به زمینه (متن) مورد نظر است. برچسب گذاری واژگانی عملی اساسی برای بسیاری از حوزه های دیگر پردازش زبان طبیعی(NLP) از قبیل ترجمه ماشینی، خطایاب و تبدیل متن به گفتار می باشد. تا کنون مدل ها و روش های زیادی برای برچسب گذاری در زبان های مختلف استفاده شده است. بعضی از این روش ها عبارتند از:

مدل مخفی مارکوف (Markov Hidden Model)
برچسب گذاری مبتنی بر تبدیل یا قانون (Transformation/Rule -based tagger)
سیستم های مبتنی بر حافظه (Memory-basedSystem
سیستم های ماکزیمم آنتروپی (Maximum Entropy System)

——————————————————————–

پارسر زبان فارسی

به موازات پیشرفت و تحولات نظری در زبان‌شناسی جدید، روش‌های تحلیل متون و دستورات زبان بوسیلهی رایانه نیز تحول یافته است. منظور از گرامر هر زبان، در دست داشتن یک سری دستورات زبانی قابل فهم برای رایانه است که به کمک آنها بتوان اجزای نحوی یک جمله را به طور صحیح تفکیک نمود. تجزیه و تحلیل جمله و شکستن آن به اجزای تشکیل دهنده مانند گروه های اسمی، فعلی، قیدی و غیره توسط ابزاری به نام پارسر صورت می گیرد که نقش اساسی در طراحی و یا افزایش دقت سایر ابزارهای پردازش متن دارد.

پارسر طراحی شده برای زبان فارسی در این پروژه، از ساختار لغات، موقعیت و ترتیب لغات در جمله، حروف یا عبارات قبل و بعد از آنها و نوع لغات، درخت نحوی یا پارسینگ را برای جملات متن تشکیل می دهد. در واقع عملیات پارسینگ با توجه به ریختشناسی (مطالعه ساختار و حالتهای مختلف یک کلمه) و همچنین دستورات نحوی گرامر زبان فارسی صورت میگیرد. بدیهی است هر چقدر نگارش بکار رفته در جملات و همچنین رعایت علائم سجاوندی طبق اصول و با دقت بیشتری صورت گرفته باشد، عملیات پارسینگ با کیفیت بهتری صورت خواهد گرفت و اجزای تشکیل دهنده ی جمله با عملیات کمتر و ساده تری برچسب زده خواهند شد.

یک فایل فشرده حاوی فایل EXE (شامل ابزارهای پیش پردازش متون زبان فارسی : نرمالسازی – ریشه یابی – برچسب زنی نحوی – پارسر )

کد سی شارپ همراه با کتابخانه های مورد نیاز جهت ریشه یابی کلمات فارسی:

در این نمونه کد، که به زبان سی شارپ نوشته شده است، کتابخانه های لازم برای استفاده از کد ریشه یاب زبان فارسی که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد تولید شده است، به کد اضافه شده و چگونگی استفاده از این کتابخانه ها در کد مشخص است و در قالب ابزاری جهت دادن ورودی و مشاهده خروجی آماده شده است.

در کد موجود در فایل ضمیمه سه کتابخانه (فایل dll) اضافه شده اند که امکان شناسایی افعال و ریشه یابی کلمات را فراهم می آورند…

برای استفاده از نرم افزار در صورت اجرا نشدم برنامه در فایل EXE، ابتدا بسته نرم افزاری دات نت فریمورک ۴.۵ را نصب نمایید.

برای دانلود با تخفیف ویژه اینجا کلیک کنید

دانلود با لینک مستقیم

ابزارهای لازم برای پردازش متن در زبان فارسی - متن کاوی

ابزارهای لازم برای پردازش متن زبان فارسی کاوی ابزار لازم برای پردازش متن

yarafile شنبه 15 خرداد 1395 ساعت 15:38

0 نظر

استفاده از داده کاوی در دسته بندی خودکار اسناد متنی

اختصاصی از هایدی استفاده از داده کاوی در دسته بندی خودکار اسناد متنی دانلود با لینک مستقیم و پر سرعت .

استفاده از داده کاوی در دسته بندی خودکار اسناد متنی

دانلود با لینک مستقیم

استفاده از داده کاوی در دسته بندی خودکار اسناد متنی

استفاده داده کاوی دسته بندی خودکار اسناد متنی تحقیق مقاله

yarafile چهارشنبه 12 خرداد 1395 ساعت 17:31

0 نظر

کاربرد داده کاوی در تجارت الکترونیک

اختصاصی از هایدی کاربرد داده کاوی در تجارت الکترونیک دانلود با لینک مستقیم و پر سرعت .

کاربرد داده کاوی در تجارت الکترونیک

فرمت فایل:doc

تعداد صفحات: 130

فهرست مطالب

بخش اول آشنایی با مفهوم داده کاوی.. 1

فصل اول معرفی و آشنایی با مفاهیم اولیه. 2

مقدمه. 2

1-1 عناصر داده کاوی.. 8

1-2 فنون داده کاوی.. 9

پردازش تحلیلی پیوسته: 9

1-3 کاربردهای داده کاوی.. 11

1-3-1 داده کاوی و کاربرد آن در کسب و کار هوشمند بانک.... 12

1-3-2 داده کاوی درمدیریت ارتباط بامشتری.. 13

1-3-3 کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی.. 14

مدیریت موسسات دانشگاهی.. 15

محدودیت ها 16

1-3-4 داده کاوی آماری و مدیریت بهینه وب سایت ها 16

1-4 داده کاوی در مقابل پایگاه داده. 17

1-5 ابزارهای تجاری داده کاوی.. 18

1-6 منابع اطلاعاتی مورد استفاده. 19

1-6-1 انبار داده. 19

فصل دوم مسائل کسب و کار برای داده‌کاوی.. 20

2-1 مسائل کسب و کار برای داده‌کاوی.. 20

2-2 چرخه تعالی داده کاوی چیست؟. 22

2-2-1 تعیین فرصت‌های کسب‌و‌کار و تجارت... 23

2-2-2 مشکلات در راه کسب توانایی استفاده از نتایج داده کاوی.. 23

2-2-3 انجام عمل.. 24

2-2-4 اندازه گیری نتایج.. 24

2-3 متدلوژی داده‌کاوی و بهترین تمرین‌های آن.. 25

2-3-1 چرا یک متدلوژی داشته باشیم؟. 25

یادگیری چیزهایی که درست نیستند.. 26

الگوهایی که ممکن است هیچ قانون اصولی را ارائه نکنند.. 26

چیدمان مدل ممکن است بازتاب دهنده جمعیت وابسته نباشد.. 27

2-3-2- یادگیری چیزهایی که درست ولی بلااستفاده‌اند.. 29

2-4 مدل‌ها، پروفایل‌سازی، و پیش‌بینی.. 30

2-4-1 پروفایل‌سازی.. 32

2-4-2 پیش بینی.. 33

2-5 متدلوژی.. 33

مرحله 1: تبدیل مسئله کسب و کار به مسئله داده‌کاوی.. 34

مرحله 2: انتخاب داده مناسب... 35

مرحله سوم: پیش به سوی شناخت داده. 38

مرحله چهارم: ساختن یک مجموعه مدل.. 39

مرحله پنجم: تثبیت مسئله با داده‌ها 41

مرحله ششم: تبدیل داده برای آوردن اطلاعات به سطح.. 42

مرحله هفتم: ساختن مدلها 45

مرحله هشتم: ارزیابی مدل ها 45

مرحله نهم: استقرار مدل ها 48

مرحله 10: ارزیابی نتایج.. 48

مرحله یازدهم: شروع دوباره. 48

فصل سوم وظایف داده‌کاوی‌.. 49

8- تحلیل انحراف... 55

9- نمایه‌سازی.. 55

بخش دوم داده کاوی در تجارت الکترونیک... 57

فصل اول مقدمه ای بر تجارت الکترونیکی.. 58

1-1- طبقه‌های مختلف تجارت الکترونیکی.. 60

1-1-1- سازمانهای تجاری یا مصرف‌کنندگان (B2C). 60

1-1-2- تجارت الکترونیکی مصرف‌کننده با مصرف‌کننده (C2C). 61

1-1-3- تجارت الکترونیک مصرف‌کننده با سازمان تجاری.. 61

1-2- تفاوت تجارت الکترونیکی با تجارت سنتی.. 61

1-3- ارتباط با مشتری از طریق ابزارهای الکترونیکی.. 62

1-4- نقش دولت در تجارت الکترونیک.... 63

فصل دوم شکل دهی موقعیت بازار. 64

2-1- چار چوبی برای تحلیل موقعیت بازار. 65

2-1-1- پرورش موقعیت : 65

2-1-2 -کشف هسته اصلی موقعیت : 66

2-1-3- شناسایی مشتریان هدف : 66

2-1-4- مطالعه توانمندیها و منابع شرکت : 66

2-1-5- اندازه گیری جذابیت موقیت : 66

2-2- ویژگی های تحلیل موقعیت بازار در اقتصاد جدید: 67

2-2-1- رقابت بین مرزهای اتفاق می افتد نه درون مرزهای صنعت: 67

2-2-2- اقدامات رقابتی و واکنش ها با سرعت بی سابقه ایی رخ مید هند: 67

2-2-3- رقابت بین ائتلاف شرکت ها رخ میدهد نه به تنهایی: 68

2-2-4- تاثیر گزاری و تغییر رفتار مشتریان ازحالت سنتی ساده تر است: 68

2-2-5- زنجیره ی ارزش ( value chain). 68

2-3- دو نوع ارزش ( value type ) عمده. 69

2-3-1 - ارزش های در بند.. 70

2-3-2- ارزش های جدید ( New-To-The-World value ) : 70

2-4- شناسایی نیاز های برآورده شده و برآورده نشده. 72

2-4-1 فرآیند تصمیم گیری مشتری.. 72

2-4-2- آشکارسازی نیازهای برآورده شده و برآورده نشده. 73

2-5- تعیین مشتریان ویژهای که شرکت قصد متقاعد کردن آنهارا دارد. 74

2-5-1- روشهایی برای تقسم بندی بازار: 75

2-5-2- تقسیم بندی قابل اجرا و معنی دار. 76

تقسیم بندی قابل اجرا(Actionable Segmentation). 76

تقسیم بندی معنی دار. 76

2-5-3- ترکیب مناسبی از متغیر ها 77

2-5-4-تناظر بازار و مشتریان هدف... 78

2-6- تأمین منابع.. 79

2-6-1- منابع شرکت : 79

2-6-2- شرکاﺀ : 80

2-7- جذابیت یک موقعیت : 81

2-7-1- شدت رقابت... 81

2-7-2- پویایی های مربوط با مشتریان : 82

2-7-3- فناوری : 83

2-7-4- سود دهی مالی : 84

2-8- ارزیابی نهایی(go/No-go). 85

مدلهای کسب و کار. 85

2-9- مدلهای سوددهی برای شرکتهای آنلاین چه هستند؟. 92

2-9-1- مدلهای سوددهی مورد توجه سهام داران. 92

2-9-2- مدلهای مبتنی بر کاربر و شرکت: 93

2-9-3- مدلهای مبتنی بر خلق ارزش توسط شرکت: 94

2-10- واسط مشتری.. 97

2-10-1- هفت عنصر طراحی برای واسط مشتری.. 97

2-10-2- چه چیز تعیین کننده جلوه یک وب سایت است؟. 100

2-10-3- محتویات وب سایت... 103

2-10-4- تشکل ها در سایت... 105

2-10-5- اهرمهای مورد استفاده برای سفارشی کردن یک سایت... 109

2-10-6- یک سایت چگونه با مشتریان خود ارتباط بر قرار می کند؟. 111

2-10-7- اتصال یک وب سایت با وب سایتهای دیگر. 113

2-10-8- اشکال مختلف تجارت در وب سایت... 115

2-11- تبادل الکترونیکی داده ها (EDI). 117

1- انواع خرید یک شرکت... 117

2- خرید مواد مستقیم.. 117

3- تبادل الکترونیکی داده ها (EDI) 118

4- EDI های نسل آینده. 119

منابع..

121

مقدمه

از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (1950) پس از حدود 20 سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات(IT) هر دو سال یکبار حجم داده ها، دو برابر شده و همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه داده ها چنان گسترش یافته‌اند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند.امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با رایانه های موجود است.[3]

حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن حانبارهای عظیمی از داده ها شده است.

این واقعیت، ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است، چنان که در عصر حاضر گفته می شود اطلاعات طلاست.

هم اکنون در هر کشور، سازمان، شرکت و غیره برای امور بازرگانی، پرسنلی، آموزشی، آماری و غیره پایگاه داده ها ایجاد یا خریداری شده است. به طوری که این پایگاه داده ها برای مدیران، برنامه ریزان، پژوهشگران جهت، تصمیم گیری های راهبردی، تهیه گزارش های مختلف، توصیف وضعیت جاری خود و سایر اهداف می تواند مفید باشد. بسیاری از این داده ها از نرم افزارهای تجاری، مثل کاربردهای مالی، ERPها، CRMها و web log ها، می آیند.

نتیجه این جمع آوری داده ها این می‌شود که در سازمانها، داده ها غنی ولی دانش ضعیف، است. جمع آوری داده ها، بسیار انبوه می‌شود و بسرعت اندازه آن افزایش می یابد و استفاده عملی از داده ها را محدود می سازد.[2] داده‌کاوی استخراج و تحلیل مقدار زیادی داده بمنظور کشف قوانین و الگوهای معنی دار در آنهاست.

هدف اصلی داده کاوی، استخراج الگوهایی از داده ها، افزایش ارزش اصلی آنها و انتقال داده ها بصورت دانش است.

داده‌کاوی، بهمراه OLAP، گزارشگری تشکیلات اقتصادی(Enterprise reporting) و ETL، یک عضو کلیدی در خانواده محصول Business Intelligence(BI)، است.[2]

حوزه‌های مختلفی وجود دارد که در آنها حجم بسیاری از داده در پایگاه‌داده‌های متمرکز یا توزیع شده ذخیره می‌شود. برخی از آنها به قرار زیر هستند: [6]

کتابخانه دیجیتال: یک مجموعه سازماندهی شده از اطلاعات دیجیتال که بصورت متن در پایگاه‌داده‌های بزرگی ذخیره می شوند.
آرشیو تصویر: شامل پایگاه‌داده بزرگی از تصاویر به شکل خام یا فشرده.
اطلاعات زیستی: بدن هر انسانی از 50 تا 100 هزار نوع ژن یا پروتئین مختلف ساخته شده است. اطلاعات زیستی شامل تحلیل و تفسیر این حجم عظیم داده ذخیره شده در پایگاه‌داده بزرگی از ژنهاست.
تصاویر پزشکی: روزانه حجم وسیعی از داده‌های پزشکی به شکل تصاویر دیجیتال تولید می‌شوند، مانند EKG، MRI، ACT، SCAN و غیره. اینها در پایگاه‌داده‌های بزرگی در سیستم‌های مدیریت پزشکی ذخیره می شوند.
مراقبت‌های پزشکی: بجز اطلاعات بالا، یکسری اطلاعات پزشکی دیگری نیز روزانه ذخیره می‌شود مانند سوابق پزشکی بیماران، اطلاعات بیمه درمانی، اطلاعات بیماران خاص و غیره.
اطلاعات مالی و سرمایه‌گذاری: این اطلاعات دامنه بزرگی از داده‌ها هستند که برای داده‌کاوی بسیار مطلوب می‌باشند. از این قبیل داده‌ها می‌توان از داده‌های مربوط به سهام، امور بانکی، اطلاعات وام‌ها، کارت‌های اعتباری، اطلاعات کارت‌های ATM، و کشف کلاه‌برداری‌ها می باشد.
ساخت و تولید: حجم زیادی از این داده‌ها روزانه به اشکال مختلفی در کارخانه‌ها تولید می‌شود. ذخیره و دسترسی کارا به این داده‌ها و تحلیل آنها برای صنعت تولید بسیار بااهمیت است.
کسب و کار و بازاریابی: داده‌ لازم است برای پیش‌بینی فروش، طراحی کسب و کار، رفتار بازرایابی، و غیره.
شبکه راه‌دور: انواع مختلفی از داده‌ها در این صنعت تولید و ذخیره می شوند. آنها برای تحلیل الگوهای مکالمات، دنبال کردن تماس‌ها، مدیریت شبکه، کنترل تراکم، کنترل خطا و غیره، استفاده می‌شوند.
حوزه علوم: این حوزه شامل مشاهدات نجومی، داده زیستی، داده ژنومیک، و غیره است.
WWW: یک حجم وسیع از انواع مختلف داده که در هر جایی از اینترنت پخش شده‌اند.

در بیشتر این حوزه‌ها، تحلیل داده‌ها یک روال دستی بود. یک تحلیلگر کسی بود که با داده‌ها بسیار آشنا بود و با کمک روش‌های آماری، خلاصه‌هایی تهیه و گزارشاتی را تولید می‌کرد. در یک حالت پیشرفته‌تر، از یک پردازنده پیچیده پرسش استفاده می‌شد. اما این روش‌ها با افزایش حجم داده‌ها کاملا بلااستفاده شدند.

واژه های «داده‌کاوی» و «کشف دانش در پایگاه داده»[1] اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان یک فرآیند در شکل1 نشان داده شده است.

کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها می‌باشد. داده‌کاوی، مرحله‌ای از فرایند کشف دانش می‌باشد و شامل الگوریتمهای مخصوص داده‌کاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می کند[3Error! Reference source not found.]. به بیان ساده‌تر، داده‌کاوی به فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق می‌شود.

تعریف دیگر اینست که، داده‌کاوی گونه‌ای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیم‌گیری از قطعات داده می‌باشد، به نحوی که با استخراج آنها، در حوزه‌های تصمیم‌گیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند.

داده‌ها اغلب حجیم، اما بدون ارزش می‌باشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه[2] گفته می‌شود.

[1] Knowledge Discovery in Database

[2] Secondary Data Analysis

دانلود با لینک مستقیم

کاربرد داده کاوی در تجارت الکترونیک

کاربرد داده کاوی تجارت الکترونیک

yarafile دوشنبه 3 خرداد 1395 ساعت 18:46

0 نظر

هایدی

پیوندها

دسته‌ها

ابر برجسب

جدیدترین یادداشت‌ها

بایگانی

جستجو

دانلود مقاله با موضوع نگاهی بر داده کاوی و کشف قوانین وابستگی

داده کاوی با استفاده از اتوماتای یادگیر

ابزارهای لازم برای پردازش متن در زبان فارسی - متن کاوی

استفاده از داده کاوی در دسته بندی خودکار اسناد متنی

کاربرد داده کاوی در تجارت الکترونیک