بررسی موقعیت در بازار CRM
گروه فایل کاربردی
توضیحات :
فهرست مطالب
عنوان | صفحه |
بخش اول : تأثیر استخراج دادهها بر CRM........... 1
فصل اول : روابط مشتری
مقدمه............................................ 2
استخراج دادهها چیست.............................. 5
یك نمونه ........................................ 6
ارتباط با فرآیند تجاری .......................... 8
استخراج دادهها و مدیریت روابط مشتری ............. 11
استخراج دادهها چگونه به بازاریابی بانك اطلاعاتی كمك مینماید 12
امتیاز دهی ...................................... 13
نقش نرمافزار مدیریت مبارزه....................... 13
افزایش ارزش مشتری ............................... 14
تركیب استخراج دادهها و مدیریت مبارزه ............ 15
ارزیابی مزایای یك مدل اسخراج داده ها ............ 15
فصل دوم: استخراج دادهها و ذخیره دادهها- یك منظره مرتبط به هم
مقدمه ........................................... 17
استخراج دادهها و ذخیره دادهها ، یك ارتباط ....... 18
بررسی ذخیره دادهها............................... 21
ذخیره دادهها ROI................................. 21
ذخایر داده های علمی واطلاعاتی .................... 23
تعریف و خصوصیات یك مخزن اطلاعاتی ................ 30
معماری انباردادهها .............................. 34
استخراج دادهها .................................. 38
استخراج دادههای تعریف شده ....................... 38
قملروهای كاربرد استخراج دادهها................... 40
مقولههای استخراج دادهها و كانون تحقیق ........... 41
فصل سوم: مدیریت رابطه با مشتری
مقدمه............................................ 48
سودمندترین مشتری ................................ 49
مدیریت رابطه مشتری............................... 50
بانك اطلاعاتی متمركز برمشتری ..................... 53
اداره مبارزات ................................... 54
تكامل تدریجی بازاریابی .......................... 56
بازاریابی حلقه بسته ............................. 57
معماریCRM....................................... 57
نسل بعدیCRM..................................... 58
بخش دوم: بنیاد - تكنولوژیها و ابزار ............. 60
فصل چهارم : اجزاء ذخیره سازی دادهها
مقدمه ........................................... 61
معماری كلی ...................................... 62
بانك اطلاعاتی انبار دادهها ....................... 63
ابزارهای ذخیرهسازی، تحصیل، تهذیب و انتقال ....... 64
متادیتا.......................................... 65
ابزار دسترسی .................................... 70
دسترسی و تجسم اطلاعات ............................ 71
اصول مشاهده یا تجسم دادهها ...................... 72
ابزار بررسی و گزارش ............................. 76
كاربردها ........................................ 77
ابزار OLAP...................................... 77
ابزارها استخراج دادهها .......................... 78
مقدمه
بازار ابزار استخراج داده ها از دو راه ابتدایی خود در حال ظهور میباشد . بسیاری از ابزارهایی كه در اینجا توضیح داده میشوند ، در مرحلة اول انتشار میباشند.
موقعیت در بازار CRM كه عموماً بخشی از سیستم تجارت الكترونیكی در نظر گرفته میشود ، پیچیده تر میباشد و بنابراین با سرعت وب یا شبكه در حال حركت میباشد. بازار CRM ، حتی بیشتر از بازار ابزار استخراج دادهها با چندین فروشنده كه بر تعریف خود بازار و موقعیت خود در این بازار متمركزند ، توصیف میگردد.
این اشتباه، با ماهیت بسیار دینامیك خود بازار كه یك فعالیت قابل رویت تحكیم مشتری، شركتهای ادغامیو تملیك ها را تحمل میكند، بیشتر میگردد. علی رغم كل این چالشها، باز رو به تكامل میرود و فروشندگان، پیشرفت مهمیدر علمیبودن ابزار، قابلیت استفاده و قابلیت اداره كسب میكنند.
اولین بخش این فصل ، به كاربردهای بسته بندی شده استخراج داده ها میپردازد. این كاربردها ، بر اساس چندین تكنیك استخراج داده ها ادغام شده در ابزارهای بهتر میباشد . همراه با بهترین عملكرد ها ، اسلوب شناسی های خوب تعریف شده و فرآیندها، راه خود را در محیط های تولید شركتها كه در آن استخراج داده ها بخشی از یك فرآیند موسسه ای شده میشود مییابند كه شامل رشد و یادگیری سازمانی میشود .
بازار استخراج داده ها
بیائید بازار استخراج داده ها را از نقطه نظر منحنی اقتباسی تكنولوژی در نظر بگیریم ایمنی به اقتباس كنندگان اولیه ، از تكنولوژی لبة یادگیری برای دستیابی به مزیت رقابتی استفاده میكنند ؛ هنگامیكه تكنولوژی تكامل مییابد ، شركتهای بیشتری آن را اقتباس میكنند ، و در یك حالت تجارت زمانی و عادی درج مینمایند . همچنین مناطق عملی بودن ابزاهای استخراج داده ها بزرگتر و بزرگتر میشوند. به عنوان مثال ، تكنولوژی وایت اوك ( یك شركت استخراج داده ها در مریلند) از جانب كمیسیون فدرال الكترون، مجوز فروش سیستم گچین ماینر Capain Miner را كسب كرده است كه بی نظمیدر دخالتهای سیاسی فدرال را كشف میكند . نورتل، یك بسته كشف كلاهبرداری را توسعه داده است به نام سوپر اسلوت فراود ادوایسور ، كه از تكنولوژیهای شبكة عصبی استفاده میكند .
صنعت ابزار استخراج داده ها ، برخلاف تكنولوژیهای استخراج داده ها ، در مرحلة عدم تكامل قرار دارد و میكوشد تا بازار را تعیین نماید . و وجودش را تائید كند . به همین دلیل است كه در مییابیم بازار ابزارهای استخراج داده ها تحت تاثیر موارد زیر قرار دارد:
qادغام پیوسته و مداوم ابزارها با اتكاء به تكنولوژیهای مكمل و به عنوان مثال OLAP
q ظهور كاربردهای بسته بندی شدة عمودی و یا اجزاء استخراج داده ها برای توسعة كاربرد .
q استراتژیهای بسیار اقتباس شده شركت بین فروشندگان ابزار استخراج داده ها و فروشندگان تهیه كنندگان راه حل جامع و ادغام كننده های سیستم ها : فروشندگان مقیاس مؤسسه ، همانند IBM NCR ، اوراكل ، میكروسافت ) به عنوان مثال ، اوراكل چندین شریك متعدد استخراج داده ها به عنوان بخشی از او را كل ویرهاوس اینتیشیتیو از جمله آنگاسن دیتا مایند ، دیتاپكیج اینفورمیشن دیسكاوری ، SRA SPSS اینترنشنال و تینكینگ ماشینز را انتخاب كرده است .
اصول طبقه بندی ابزارهای استخراج داده ها
ما میتوانیم كل بازار ابزارهای استخراج داده ها را به سه گروه اصلی تقسیم نمائیم ؛ ابزارهای دارای هدف كلی ، ابزارهای ادغام شدة استخراج داده ها DSSOLAP ، و ابزارهای به سرعت در حال رشد و برای كاربرد.
ابزارهای هدف كلی بخش بزرگتر و كامل تر بازار را اشغال میكند . آنها بنا به تعریف و برای كاربرد نیستند و حوزه آنها از نظر ماهیت افقی است . این ابزار شامل موارد زیر میشود .
· SAS اینترپراز ماینر
· IBM اینتلیجنت مایننر
· یونیكا PRW
· SPSS كلمنتین
· SGI ماین ست
· اوراكل داروین
· آنگاس نالج سیكر
بخش ابزار مركب یا اداغام شدة استخراج داده ها بر شرط تجاری بسیار واقعی و اجباری داشتن ابزار چند منظورة تقویت تصمیم تاكید میكند كه گزارش مدیریت ، پردازش تحلیلی روی خط ، و قابیت های استخراج داده ها در یك قالب كاری عادی را فراهم میكند . نمونه های این ابزار های مركب شامل كاكنوس سیناریو و بیزینس آبجكت میشود.
بخش ابزارهای ویژة كاربرد ، به سرعت در حال حركت است ، و فروشندگان در این فضا ، میكوشند تا خود را با ارائة راه حلهای تجاری به جای جستجوی تكنولوژی برای یك راه حل ، از سابرین متمایز نمایند . حوزة این ابزار ، بنا به تعریف از نظر ماهیت عمودی است . در بین این ابزارها ، موارد زیر قرار دارند:
· KD1 ( متمركز بر خرده فروشی است )
· حق انتخابها و انتخابها ( بر صنعت بیمه متمركز است )
· HNC ( بر كشف كلاهبرداری متمركز است )
· یونیكا مدل 1 ( بر بازاریابی متمركز است )
ارزیابی ابزار : صفات و اسلوب شناسی ها
كل این عوامل ارائه یك توصیف بهینه از ابزارهای استخراج طولانی تر موجود را مشكل ساخته است . بنابراین . بطور كلی ابزارهای استخراج داده ها را میتوان با استفاده از صفات زیر ، توصیف نمود :
qتكامل محصول و ثبات و استحكام شركت . به دلیل عدم تكامل كلی بازار تجاری برای ابزارهای استخراج داده ها ، این مقوله محصولاتی را توضیح میدهد كه برای جنبش از چند سال وجود داشته اند.
q سكوها و معماری. سكوهای متنوع از نظر تجاری موجود را تقویت كنید ، مدل چند تأبیری مشتری / خادم را تقویت كنید . هدف قابلیت سنجش، دسترسی به سرعت نزدیك به خطی و سنجش زمان اجرا ، به عنوان میزان داده ها ( اندازة بانك اطلاعاتی ) ، تعداد متغیرها ، و تعداد كاربران متصل به هم میباشد كه در حال رشد هستند .
q تداخلهای داده ها ، قابلیت ابزار برای دسترسی به بانكهای اطلاعاتی ارتباطی ، فایلهای یكنواخت و سایر فورمتها.
q قابلیتهای استخراج داده ها از جمله تكنیكها ، الگوریتم ها و كاربردهای تحلیلی ، تكنیكهای استخراج داده ( ANN ، CART ، ایفاء قانون و غیره ) با تداخل عادی كاربر كه ابزار میتواند آن را تقویت نماید، توانایی ایجاد و مقایسة چندین مدل ؛ و توانایی برای تقویت تعدادی از انواع مختلف تجزیه و تحلیل از جمله طبقه بندی ، پیشگویی و كشف اتحاد.
q ایجاد داده ها قابلیت تغییر شكل و طبقه بندی متغیرهای پیوسته ، ایجاد متغیرهای جدید ، استفاده از تاریخها و زمان ، استفاده از ارزشهای از دست رفته و غیره.
q مدل (خصوصیت تفسیر ، ارزیابی ، صف بندی) . این مقوله ، ابزار را از نظر قابلیت انجام كارهای زیر ، ارزیابی میكند:
· شناسایی مدل بطور اتوماتیك یا دستی ، توسط كاربر
· توضیح نتایج و تعریف مقایسهای اعتمادی یعنی احتمالات طبقه بندی ، حدود اعتماد و غیره
· ارزیابی نتایج مدل با درجه و تناسب
· گزارش دخالت و سهم هر متغیر در مدل ، گزارش درجة افزایش و غیره
· صف بندی مدل برای امتیاز بانكهای اطلاعاتی منبع
· استخراج مقرارت از مدل
· دسته بندی قوانین استخراج شده در یك شكل استاندارد ( به عنوان مثال كد SQL، اظهارات روشی )
qعملكرد
· اعتبار پیشگویی اعتبار بر اساس نرخ خطای نمونة پیشگویی میباشد ؛ اعتبار مدل را میتوان با درجة افزایش اندازه گیری نمود.
· كارایی پردازش . اجزای بهینة زمان اجرای الگوریتم ها
qتداخلهای كاربر . این مقوله در مییابد آیا ابزار یك كاربر مبتدی و یا كارشناس را تقویت میكند یا نه و موارد زیر را تقویت مینماید:
· الگوهای سنجش تجاری . قابلیت ایجاد الگوهای از قبل بسته بندی شده ، برای تقویت بسته های تجاری ویژه ( به عنوان مثلا بازاریابی هدف ، امتیازدهی اعتبار، كشف كلاهبرداری ).
· تداخل متادیتا . قابلیت تقویت وظیفة طراحی معنایی ؛ دستیابی به متادیتا برای كدگذاری جداول مقادیر مقوله ای ، دستیابی به قوانین استخراج ، تغییر شكل و مهاجرت به تعریف دیدگاه تجاری خروجی مدل
qقابلیت اداره
· كنترل پیچیدگی . این یكی از روشهای اصلاح تصمیم مدل است ، بنابراین مدل را بیشتر قابل اداره مینماید . به عنوان مثال ، استفاده از پارامترهای بسیار آزاد منجر به تناسب بیش از حد میگردد ( قبلاً بحث شد ) ؛ این پیچیدگی را میتوان با زوال وزن ، كنترل نمود . الگوریتم های درخت تصمیم CART از فاز شاخه زنی یا ضریب برای كاهش پیچیدگی مدل درخت استفاده مینمایند .
· سختی . اعتبار درخت و موجود بودن به قابلیت یا بهبود سریع از یك نقطة ضعف . استفاده از اجزاء كلیدی به منظور ادغام در قالب كاری مدیریت سیستم ها ( به عنوان مثال BMCpatrol ، Tivolitme10 و غیره.)
· مرسوم سازی . قابلیت ابزار برای ایجاد یك معماری باز، انعطاف پذیر و قابل گسترش با تداخلهای برنامه ریزی كاربرد منتشر شده و نقاط خروجی كاربر كه امكان این كاربردهای تقویت تصمیم، ویژة كاربر و همینطور ادغام با سایر كاربردها را فراهم میآورد.
هر گاه كه ممكن باشد، ما ابزارهایی كه از این مقوله ها استفاده میكند را مورد بحث قرار خواهیم داد. با این وجود ، به دلیل این كه هدف این فصل ، ایجاد یك بررسی كلی از ابزرهای برجسته و استخراج داده ها میباشد و صفات یا خصوصیات عملكرد كه میتوانیم تنها با انجام یك ارزیابی جامع از محصول با استفاده از دادهها بدست آوریم ، در این بحث در نظر گرفته نخواهد شد . دیگر این كه فروشنده یك معیار منتشر شده یا اطلاعات بررسی كاربر در مورد عملكرد ابزار را فراهم نماید.
ارزیابی ابزار
ابزارهایی كه بطور مفصل در این فصل بحث شد ، شامل كلمنتین (SPSS) ، كاكنوس 4t hought ، كاكنوس سناریو ، دینا ماینر دیتا مایند ) ، داروین ( اوراكل ) ایستگاه كاری استخراج بانك اطلاعاتی (HNC) سریهای تصمیم ( نئوویستا ) ، اینترپرایزماینر SAS . اینتلیجنت ماینر (IBM) ، نالوج سیكر و نالوج استادیو (AGNOSS) ، و مدل 1 و PRW ( یونیكا ) . ابزارهای دیگر بطور مختصر مورد بحث قرار میگیرند . سطح جزئیات موجود برای برخی از این ابزارها به دلیل فقدان تكامل محصول محدود میباشد . این ابزارها به ترتیب حروف الفبا مورد بحث قرار میگیرند.
كلمنیتین (SPSS)
بررسی ، كلمنیتین ، یك ابزار كاربرد استخراج داده ها از SPSS میباشد . این ابزار یك تداخل كاربر گرافیكی را با چندین نوع تكنیكهای تجزیه و تحلیل از جمله شبكه های عصبی به قوانین اتحاد و تكنیكهای القاء قانون ، تركیب میكند . این قابلیتهای فنی ، در یك محیط برنامه ریزی دیداری كه استفاده از آن ساده است ارائه میشوند .
استعارة گرافیكی كه كلمنتین استفاده میكند، استعارة گرفتن ، انداختن و اتصال گره های عمل روی صفحه است. گره هایی برای دسترسی داده ها ، ساخت دادهها ، تجسم داده ها ، یادگیری ماشین ، تجزیه و تحلیل مدل وجود دارد . فرایند توسعة مدلی مركب از انتخاب گره های صحیح از یك پالت ، قرار داده آنها روی صفحه و اتصال گره ها میباشد.
كلمنتین دارای یك سری غنی از قابلیت های دسترسی اطلاعات از جمله فایلهای یكنواخت و بانكهای اطلاعاتی ارتباطی ( از طریق ODBC ) میباشد . بیشتر، كلمنتین قابلیت دائمیساختن نتایج طراحی را از طریق نوشتن آنها در ODBC – Compliant DBMS دارد.
ساخت داده های ورودی شامل هماهنگی در نماها و توانایی اشتقاق حوزه های جدید ، میشود . قابلیت های تجسم داده های كلمین شامل نمودارهای پراكندگی ، طرحهای خطی و تجزیه و تحلیل وب میباشد.
كلمنتین روی سیستم های اینتل پنتیو اجرا میشود كه سریهای ویندوز ، NT ، HP 9000 كه HPUX10 و بالا سیلیكون گرافیكس كه IRIX ، Sun SPARC كه سولاریس 2.x و دیجیتال APLHA كه دیجیتال UNIX 3.X یا VMS 6.X را اجرا میكند .
دسترسی به اطلاعات ساخت و پیش پردازش . كلمنتن فایهای متن تحریر شده ، فایلهای ارزش مجزا شده با كاما و فایلهای ثبت ثابت (ASCII) را وارد میكند . سایر منابع اطلاعاتی از طریق یك تداخل ODBC حمایت میشوند . سیستم های بانك اطلاعاتی ارتباطی اصلی ، از جمله اوراكل سیباس ، اینفورمیكس و CA-IN gres از طریق ODBC در دسترس میباشد.
قابلیت های ساخت داده های كلمنتین شامل موارد زیر میشود:
· ادغام ثبت ها از طریق توالی ثبت
· تراز داده ها با افزایش نسبت ثبت ها با خصوصیات ویژه
· تراكم تعیین شده كاربر
· تصفیه ثبتهای بیگانه و نامربوط
· اشتقاق جدید حوزه با استفاده از فرمولهای تعیین شدة كاربر و اپراتورهای منطقی
· قابلیت های نمونه گیری داده هاا ، از جمله اولین و آخرین N ثبت ، 1 در N نمونه گیری ، و نمونه گیری اتفاقی تكنیك های استخراج داده ها ، الگوریتم ها و كاربردها
· كلمنتین ـ الگوریتم های القایی قانون ـ شبكه های عصبی و از جمله شبكه های كوهونن ، او قوانین مربوطه را تقویت میكند :
· درك الگوریتم های القاء قانون كلمنتین ساده میباشد : الگوریتم ها هنگامیكه آموزش داده شوند یك درخت تصمیم را ایجاد میكنند كه قانون را نشان میدهد . یك فرآیند دائمیكه دنبال میشود ، قرار دارد و متغیرهای مهم در سطوح بالای درخت و سپس آموزش شبكة عصبی با این متغیرها میشود.
· شبكه های عصبی كلمنتین در توپولوژیهای متنوع و روشهای آموزش ، ارائه میشوند . شبكة معیوب لایة پنهان برای ارزیابی عملكرد
· كلمنتین شبكه های عصبی سولمونس را بـرای حل مسائل دسته بندی ارائه میكند .
· قوانین اتحاد همانگونه كه از نامش پیداست . یك نتیجه ویژه را به یك سری از صفات ، مربوط مینماید . اتحادها را میتوان بین صفات یافت كه برای كاربردهایی همانند تجزیه و تحلیل سبد بازار ، بسیار مفید است .
· كلمنتین برش عمودی مشتری ، تجزیه و تحلیل سریهای زمانی ، تجزیه و تحلیل سه بازار و كشف كلاهبرداری را تقویت میكند .
كار با ابزار مدل در محیط برنامه ریزی دیداری با استفاده از استعارة گره های متصل ، مشخص میگردد . جعبه های دیالوگ با گره های طراحی مدل وجود دارد كه به كنترل الگوریتم ها و روشهای آموزشی كمك میكند .
كلمنتین به كاربران امكان میدهد تا در یابند كدام ورودیها در مدل دارای اهمیت در پیشگویی كننده هستند ، گر چه تغییر شبكه های عصبی ذاتاً مشكل است. الگوریتم های درخت تصمیم یك بررسی قانون دارای تاثیر متقابل ، كه استفاده از از آن ساده است را تقویت میكند .
كلمنتین حدودی از وظایف را برای ارزیابی مدل ، ارائه میدهد . اینها شامل یك گره تجزیه و تحلیل میشود كه تعداد تشخیص های صبح را برای ورودی مدل گزارش میكند ؛ مقادیر اطمینان متغیر از 0 تا 1 ، گرة ماتریس كه كاربر میتواند جدول سازی در زمینه های انتخابی را در آن انجام دهد.
كلمتین میتواند درختان تصمیم، شبكه های عصبی ، و شبكه های كوملونس را به عنوان كد C ، صادر نماید . بعد از آنكه مدل در كلمنتین ساخته شد ، آن را میتوان به عنوان كد C كه باید در محیط خارجی صف بندی شود ، صادر نمود . به عنوان مثال ، اگر مدل شبكة عصبی بایستی صادر شود . كلمنتین سه فایل را صادر خواهد نمود : یك سر فایل ، یك فایل وظیفه ، و یك فایل تعریف شبكه. قوانینی كه الگوریتم القاء قوانین ایجاد میكند ، قابل صدور میباشد.
محیط برنامه ریزی دیداری كلمنتین ، برای یك مبتدی ، مناسب است . توالی طراحی به طور مشخص ارائه میگردد و حق انتخابهای متعدد ، انعطاف پذیری را افرایش میدهند . یك كاربر كارشناسی كه مایل به ساخت الگوریتم های كلمنتین میباشد ، آن آزادی را ندارد . با این وجود ، حذف انتخابهایی در شبكه های عصبی برای تنظیم نرخ یادگیری و كنترل خستگی مشتری در الگوریتم های درخت تصمیم وجود دارد . كلمنتین الگوهای تجاری ارائه نمیكند . تداخل مقاومتها در میزان نوشتن این بحث وجود نداشت .
نتیجه گیری . كلمنتین یك محصول قوی است . در معیارهای منتشر شدة مشتری ، آن برحسب قابلیت سنجش اعتبار پیشگویی كننده و زمان پردازش خوب كار میكند . بطور كلی ، كلمنتین ، بسیار خوب با اجراهای تجزیه و تحلیل مقیاس اندك و بزرگ ، همانگ بود.
4 تفكر و سناریو ( cognos)
بررسی كوگنوس ، به عنوان یكی از رهبران در بازار OLAP ، با معرفی دو ابزار استخراج داده ها در موجودی دارایی خود از نظر مقام ، ارتقاء یافته است :
این ابزارها یا بهره برداری از شبكه های عصبی و تكنیكهای CHAID قابلیت های استخراج داده ها را ارائه میكند . بطور كلی این ابزارها در سكوهای كاكنوس تقویت میشوند. و بطور مشخص در محیط ویندوز مورد توجه قرار میگیرند . هر دو ابزار داده ها را از صفحه گسترده بانكهای اطلاعاتی و فایلهای متن Ascll تحصیل میكند .
4 thought برای رسیدگی به مسائل تجاری متنوع از جمله بهینه سازی قیمت، پیش بینی تقاضا و پیشگویی و سنجش عملكرد ایجاد میگردد . 4 thought از پیشگویی چند لایه ای ( MPL ) تكنولوژی شبكة عصبی استفاده میكند كه بسیار برای تجزیه مسائلی كه به اشكال غیر خطی ، داده های اغتشاش و مجموعه های كوچك داده ها میپردازد، هماهنگ است . دو تجزیه و تحلیل اصلی كه 4 thought ارائه داد تجزیه و تحلیل سریهای زمانی و برش عمودی مشتری هستند . تجزیة و تحلیل سریهای زمانی ، به دنبال روندهایی بر اساس رفتار متناوب هستند. در صورتیكه ، ایجاد برش عمودی مشتری به داده های دموگرافیك ، به عنوان مثال برای پیشگویی این كه آیا مشتری یك محصول ویژه را خریداری میكند یا نه میپردازد.
سناریو برای طبقه بندی و مسائل اتحاد، طراحی میشوند ؛ آن میتواند روابطی را بین متغیرها در مجموعه داده ها بیابد . سناریو از كشف تاثیر متقابل اتوماتیك مربع خی دو (CHAID) استفاده میكند ، و میتواند اشتقاقهای چند جهته را برای متغیرهای پیشگویی كننده فراهم نماید . سناریو ، استراتژیهای تجزیه و تحلیل متفاوت ، نمونه گیری اتوماتیك و تصمیم و ایجاد درخت را ارائه میدهد . با این وجود ، سناریو برای رسیدگی به متغیرهای هدف مقوله ای طراحی نمیشود. سناریو در كشف و تجسم داده ها قوی است.
ثبات سناریو و 4 thought ، تداخل كاربر جامع و درك كنندة آن است، اساساً در یك كاربر مبتدی هدف قرار میگیرد . آن از ترسیم نمودار برای تجزیه و تحلیل تك متغیره با استعاره درخت تصمیم استفاده میكند ،و نمایش دیداری خوب را برای تغییرات اطلاعاتی بین بخشها برای تجزیه و تحلیل روند و همبستگی عامل فراهم میسازد . سناریو ، دارای الگویی برای تجزیه و تحلیل اطلاعات سود از داده های رقابتی و فصلی میباشد.
كاكنوس ذكر كرد كه آن 4 thought و سناریو را با پاور پلی (OLAP ) و كاربردهای (گزارشی ) Impromtu تركیب خواهد نمود.
محصولات كاكنوس در سیستم های عملیاتی ویندوز میكروسافت اجرا میشوند (ویندوز 95 یا با راحتی ، و یا NT ).
دسترسی به داده ها ، ساخت و پیش پردازش . 4 thought میتواند داده ها را به شكل صفحه گسترده های اكسل به فایلهای لوتوس 123 ، فایلهای SPSS ، فایلهای متن صدور شده ، فایلهای ارزش با كاما جدا شده فایلهای دارای پهنای ثابت ، وارد نماید . بعلاوه ، دسترسی به بانكهای اطلاعاتی ارتباطی از طریق محرك odbc از كتابخانه و بانك اطلاعاتی Q&E تقویت میشود.
سناریو میتواند داده ها را از فایلهای یكنواخت ، صفحه گسترده اكسل ، و جداول dBase ، وارد نماید همچنین ، سناریو میتواند از كاكنوس ایمبرومتو برای وارد ساختن داده ها از بورلاند اینتربیس، سنئورا SQLBase ، اینفورمیكس ، میكروسافت SQL سرور، اوراكل ، سیبس SQL سرور ، و مسیرهای بانك اطلاعاتی اصلی از جمله مسیر MDI DB2 ، مسیر omni SQL ، مسیر اوراكل ترانس پرنت، مسیر سیبس نت ، استفاده میكند .
قابلیتهای ساخت اطلاعات شامل موارد زیر میشود.
· طبقه بندی
· جایگزینی ارزش از دست رفته ( با یك ارزش مقدم یا استفاده از تفسیر)
· تبدیل ارزش رشتة متن به ارزش عددی
· تبدیل خودكار سیاه به صفر
· تصفیه ثبت های بیگانه یا دور دست
· قابلیتهای محدود نمونة گیری داده ها و 4 thought میتواند نمونه گیر اتفاقی را تقویت نماید ، اما نمونه گیری لایه لایه وجود ندارد .
تكنیك های استخراج داده ها ، الگوریتم ها و كاربردها
4 thought از تكنولوژی شبكة عصبی پیشگویی چند لایه استفاده میكند كه طراحی ورودی به خروجی را بر اساس محاسبات گره های متصل بهم ایجاد مینماید . خروجی هر گره یك تابع غیر خطی مجموع وزن دار و ورودیهای از گرمای دو لایه های قبلی میباشد.
سناریو از الگوریتم درخت تصمیم بر اساس CHALD استفاده میكند . آن قوانینی را ایجاد میكند كه میتواند برای مجموعه داده های طبقه بندی شده برای پیشگویی این كه كدام ثبت ها پیامد مطلوب خواهند داشت كه بكار برد . الگوریتم درخت تصمیم سناریو . به اندازه كافی انعطاف پذیر است كه حق انتخاب تقسیم هر متغیر یا یك اشتقاق بر اساس اهمیت آماری به كاربر میدهد .
سناریو ، طبقه بندی وسائل اتحاد را تقویت میكند، و میتوان در ترسیم برش عمودی و تقسیم بندی بازار ، از آن استفاده نمود . 4 thought برای تجزیه و تحلیل سریهای زمانی طراحی مدل پیشگویی كننده و پیش بینی مسائل بهتر مناسب است . هر دو ابزار ، امكان تجزیه گرافیكی مواد خام از طریق نقشه های خطی میله ای و نمودار پراكندگی را فراهم میآورد. سناریو منظرة گراف و درخت را كه بر اطلاعات كلی مشابه تكیه دارد ، پیشنهاد میدهد. سناریو میتواند از متغیرهای دو تایی مداوم ، و پیشگویی كنندة مقوله ای استفاده نماید ؛ اما آن تنها از متغیر عددی به عنوان اهداف استفاده مینماید.
سناریو سه استراتژی تجزیه و تحلیل را ارائه میدهد.
· حالت طبقه بندی . حداقل به 1000 ثبت نیاز دارد ، كه نیمیاز آن برای تست حفظ میشود و به تولید نتایج با اطمینان بالا ، توجه میكند .
· حالت تست یا آزمایش ، نیازمند ثبت های كمتری میباشد ، و از یك سوم این ثبت ها برای تست استفاده میكند . و بطور كلی معیارهای كمتر بی ارزش را برای دسته بندی ارائه میدهد .
· حالت بررسی . به حداقل شرایط ثبت نیاز ندارد و برای بررسی داده های اولیه طراحی میشود .
كار با ابزار در سناریو ، ، مدلی در یك محیط برنامه ریزی دیداری با استفاده از یك افسونگر مشخص میگردد. سناریو بطور خودكار انواع متغیر را انتخاب میكند ، و به كاربر امكان میدهد تا داده ها را نمونه گیری كند و داده ها را به نمونه های آموزشی و تست، تقسیم نماید . همانگونه كه قبلاً ذكر شد ، سناریو سه استراتژی تجزیه و تحلیل را ارائه میدهند كه شناسایی ، تست و بررسی سناریو میتواند یك درخت را بطور خودكار ایجاد كند، یا به كاربر امكان میدهد تا هر بخش و قسمت را به یك درخت تبدیل كند . كاربر میتواند بطور مداوم به سادگی محصور شوند و سناریو فهرستی از متغیرهای از نظر آماری مهم درجه بندی شده را ایجاد میكند ، و میتواند بطور خوكار به متغیرهای دارای بالاترین رتبه تقسیم شود.
4 thought به كاربر امكان میدهد تا مدل شبكه عصبی را با اولین تصمیم گیری در این مورد كه آیا آن برای تجزیه و تحلیل سریهای زمانی میباشد یا نه ، شناسایی نماید . كاربر در مورد ماهیت سریهای زمانی تصمیم می گیرد (روزها ، هفته ها و ماهها و سالها و یا زمان مشخص شده توسط كاربر). برای سریهای زمانی و تجزیه و تحلیل طراحی مدل پیشگویی كننده، كاربر ، مدل را از طریق جعبه شناساسی و یا اگر مدلی ایجاد مینماید . كاربر دارای انعطاف پذیری انتخاب یك شبكة تك لایه دو لایه ، میباشد. 4 thought دو حالت از تست مدل را برای تعیین زمان توقف ارائه میدهد :
تست ساده : ابزار داده ها را به گروههای آموزشی و تست تقسیم میكند ، و از یك گروه تست در سراسر فاز آموزشی برای تعیین نقطة انقضاء وخاتمه ، استفاده میكند .
تست كامل : كه ابزار چندین مدل را ایجاد میكند ، و سعی میكند تا یك نقطة توقف بهینه را بیابد.
4 thought ، یك تفسیر گرافیكی و یك نمودار پراكندگی مدل در برابر داده های واقعی و همینطور فهرست دینامیكی از متغیرهای بحرانی را برای كاربر فراهم میكند .
در سناریو ، خواه یك نمودار یا منظرة درخت استفاده شود ، كاربر میتواند خلاصة، آمار همانند میانگین متوسط انحراف معیار و غیره را مشاهده نماید 4 thought یك گزارش آماری كامل ، یك گزارش مسطح مقطع و گزارش سناریو را ارائه میدهد . گزارش آخر ، به كاربر امكان میدهد تا مقادیر كل متغیرهای ورودی را برای برگشت پاسخ خروجی انتظاری مدل شناسایی نماید.
مدلهایی كه توسط سناریو ساخته شده قابل صدور نیستند ، اما شرحهایی تعقیبی طراحی میشوند كه دارای قوانین قابلیتهای صدور میباشد . 4 thought میتوانند در ارتباط با اكسل لوتوس 123 و spss كار نمایند . و میتوانند یك مدل آموخته شده را به صورت یك تابع ریاضی در هر یك از این محیط ها ، صف بندی نمایند.
نتیجه گیری. 4 thought و سناریو هر دو قابلیت های حمایت تصمیم كوكناس را توسعه میدهند . و عملی بودن استخراج داده ها را ایجاد مینماید . در معیارهای منتشر شده مشتری سناریو ، نتایج خوب و تداخل دوستانة كاربر را نشان میدهد . 4thought دسترسی به درجه بندی های معقول بر اساس عملكرد و اعتبار را گزارش میكند .
داروین ( اوراكل )
بررسی . داروین كه اغب، یكی از ابزارهای ابتدایی استخراج داده ها در نظر گرفته میشود، شهرتش را تائید میكند . اخیراً ، اوراكل، داروین را از شركت Thinking Machine برای افزایش پیشنهاد و تولید خود بدست آورد و خصوصاً در فضای CRM كه استخراج داده ها همانگونه كه قبلاً بحث شد، نقش بحرانی ایفا میكند . بحث زیر بر اساس خصوصیات داروین میباشد ، درست همانگونه كه Thinking Machine توسعه داده و بازاریابی كرد . و ارواكل ، تصمیم میگیرد تا هر مشخصه ، اجزاء و معماری ابزار را تغییردهد.
ابزار استخراج داده های داروین به عنوان یك محصول پیچیدة حاوی ابزار استخراج داده ها طراحی شد : شبكه های عصبی ، درخت k نزدیكترین همسایه . ابزار شبكة عصبی داروین ( Darwin Net ) یك سری جامع از توابع را برای ساخت مدل فراهم میكند . آن میتواند از پیشگویی كننده های مقوله ای و مداوم و متغیرهای هدف استفاده كند . و میتوان برای مسائل طبقه بندی ، پیشگویی ، و پیش بین مورد استفاده قرار داد.
ابزار درخت تصمیم ( درخت داروین ) از الگوریتمهای CART استفاده میكند . میتوان برای حل مسئله طبقه بندی با متغیرهای مداوم و مقوله ای مورد استفاده قرار داد. ابزار k نزدیكترین همسایه (darwin Match) را میتوان برای حل مسئله طبقه بندی متغیرهای وابستة مقوله ای و متغیرهای پیشگویی كنندة مقولهای و پیوسته مورد استفاده قرار داد.
اگر چه هر ابزار جزء دارایی نقصهای است . اما Darwin شامل یك سری كامل از توابع برای ارزیابی مدل میشود . آن خلاصة آمار ، ماتریس اغتشاش و جداول درجة افزایش را برای كل انواع مدلها ، ایجاد میكند .
داروین تداخلهای نسبتاً قوی كاربر را برای افراد مبتدی همینطور كارشناسها ارائه میدهد ، اگر چه تداخلها بهتر با یك كاربر كارشناس هماهنگ هستند.
داروین كه از یك شركت معروف به عنوان یكی از اولین سازندگان كامپیوتری موازی حاصل شده است ، مزیت زیادی در پردازش كارایی و قابلیت انعطاف پذیری دارد . الگوریتم های آن برای اثبات موازی بهینه میشوند و به اندازة كافی بهینه هستند كه در معماریهای موازی و سری اجرا میشوند . این قابلیت بطور مشخصی از توجه اوراكل فرار نكرد و به اوراكل كمك میكند تا به یك فروشنده اولیه بانك اطلاعاتی و محصـولات كاربر تبدیل شوند كه میتواند یك مؤسسه جهانی بزرگ را درجه بندی كند.
داروین به عنوان یك سیستم ارباب رجوع / سرور یا خادم طراحی میشود و سكوی خادم از پردازشگرهای متحد تا SMPS تا پردازشگرهای موازی از جمله سیستم های وینتل كه در ویندوز NT اجرا میشوند و همینطور محصولات مبتنی بر UNIX از میكور سیستم های SUN ، HP ، IBM و NER ، Compag/Digital متغیر است.
دسترسی به داده ها ، ساخت و پیش پردازش. داروین میتواند داده های محدود با طول ثابت را از فایلهای یكنواخت (ASCII) و بانكهای اطلاعاتی ارتباطی از طریق ODBC وارد نماید . بطور داخلی ، داده ها در یك قالب و فورمت اختصاص ذخیره میشوند كه میتوان بطور مؤثر در یك سیستم چندین پردازشگر ، طرح بندی نمود .
قابلیت های ساخت داده های داروین شامل موارد زیر میشود.
· قابلیت ادغام برای مجموعه داده های مجزا
· حذف متغیرها از مجموعة اطلاعاتی
· تعیین نوع متغیر ( به عنوان مثال مقوله ای مرتب شده )
· تبدیل به یك محموعة داده های سری به مجموعة داده های موازی
· نمونه گیری داده ها و جداسازی
تكنیكهای استخراج داده ها ، الگوریتم ها و كاربردها. الگوریتم های اصلی كه در زمان چاپ تقویت و تائید میشوند ، و شبكه های عصبی ، درخت تصمیم نزدیكترین همسایه میباشد.
الگوریتم های آموزشی شبكة عصبی شامل انتشار رو به عقب ، تندترین فرود یا نزول ، نیوتن اصلاح شده و غیره میباشد . توابع انتقال شامل خطی ، سیگموند ، هیپوتانژانت میشوند.
درخت تصمیم از الگوریتم های CART استفاده میكند كه میتواند به طور خودكار درخت را با انتخاب تعداد درختان فرعی كه در تجزیه و تحلیل در نظر گرفته میشود . هرس نماید.
الگوریتم K نزدیكترین همسایه بر اساس تكنیك استدلال مبتنی بر حافظه ( MBR) میباشد آن یك ارزش متغیر وابسته را بر اساس واكنشهای K نزدیكترین ثبت هماهنگ كننده در مجموعة آموزشی پیشگویی میكند كه در آنجا نزدیكی همسایه با به حداقل رساندن فاصلة وزن دارEuclidean بین متغیرها ، تعیین میشود.
شبكة عصبی داورین را میتوان برای ساخت مدلهای پیشگویی كننده و پیش بینی كننده مورد استفاده قرار دارد و متغیرهای مقوله ای و مداوم را بكار برد . درخت تصمیم و ابزارهای k نزدیكترین همسایه را برای مسائل طبقه بندی مورد استفاده قرار داد.
كار با ابزار داروین ، یك سری غنی از حق انتخابها را برای شناسایی مدل فراهم مینماید . به عنوان مثال برای شبكة عصبی ، داورین امكان شناسایی معماری شبكة عصبی ، توپولوژی ، تابع های انتقال الگوریتم آموزشی و تابع هزینة حالت یادگیری و حداكثر تعداد تكرارهای آموزشی را فراهم میآورد . این حق انتخابها كاربر كارشناس را هدف قرار میدهد.
با این وجود تفسیر شبكه های عصبی ذاتاً مشكل است. داروین ، خلاصه ای از معماری مدل ، توپولوژی اللگوریتمها ، و تابع ها را ارائه میدهد جزء درخت تصمیم مدل را به صورت یك مجموعة ساده از قوانین اگر - پس توضیح میدهد كه كاربر میتواند آن را آزمایش نماید.
داروین یك مجموعة جامع از تابعها را كه برای ارزیابی مدل از جمله گزارشات در مورد آمار خطا ، فهرستی از خطاهای طبقه بندی نادرست ، گزارشات مقایسه ای از پیامد پیشگویی شده و واقعی ، ماتریس اغتشاش و جدول درجه افزایش فراهم مینماید.
نتیجه گیری . مزیت داروین در تقویت الگوریتم ها و با طرحهایی برای افزودن الگوریتم های ژنتیكی و منطق نامعلوم میباشد . آن را میتوان در چندین سكو در شكل ارباب رجوع / خادم اجرا نمود، كه خادم ممكن است یك پردازشگر یا چندین پردازشگر متقارن، یا پردازشگر موازی باشد . در حالت خادم چند پرداشگر ، داروین میتواند از مشخصه های قابلیت سنجش سخت افزار سود ببرد . در معیارهای منتشر شده یا مشتری ، داورین عملكرد و قابلیت مقایسه قوی را نشان داد . بطور كلی داورین برای اجراها در قیاس متوسط و بزرگ ، مناسب میباشد . به عنوان مثال اخیراً داروین برای كاربردهای رابطه مشتری وفاداری مشتری توسط GTE و Credit suisse انتخاب گردید.
ایستگاه كاری استخراج بانك اطلاعتی ( HNC)
بررسی HNC یكی از موفق ترین شركتهای استخراج داده ها میباشد . ایستگاه كاری استخراج بانك اطلاعاتی (DMW) یك ابزار شبكة عصبی است كه بطور گسترده برای كاربردهای تجزیه و تحلیل كلاهبرداری كارت اعتباری قابل قبول میباشد . DMW مركب از كاربردهای نرم افزار مبتنی بر ویندوز و یك مورد پردازش مرسوم میباشد . سایر محصولات HNC شامل كاربردهای فاكون و پرافیت ماكس برای خدمات مالی و راه حل كشف كلاهبرداری سیستم كنترل سوء استفادة ارتباطات از راه دور پیشرفته (ATACS) میباشد كه hnc قصد دارد تا در صنعت ارتباطات از راه دور ، صف بندی نمایند .
شبكة عصبی DMW ، الگوریتم شبكة عصبی انتشار رو به عقب را تقویت میكند، و میتواند در حالات اتوماتیك و دستی كار كند. مدل آن را میتوان با استفاده از آمار جامع و عملی بودن برای محاسبة همبستگی های بین متغیرهای پیشگویی كننده و حساسیت آنها نسبت به یك متغیر وابسته ، تفسیر نمود.
DMW ، تعدادی از حق انتخابهای مشخص كاربر را ارائه مینماید كه امكان انعطاف پذیری مهم در اصلاح الگوریتم ، متغیر داده ها و تابعهای ساخت داده ها را فراهم میسازد . DMW بطور مؤثر متغیرهای پیوسته و مقوله ای را مورد استفاده قرار میدهد كه میتوان برای مسائل پیشگویی ، طبقه بندی و پیش بینی مورد استفاده قرار داد .
DMW، تداخلهایی را برای كاربران مبتدی و با تجربه از جمله حق انتخابهای هماهنگ كنندة پیشرفته و امكانات مورد استفاده قرار داد .
DMW ، برای ایجاد یك مدل معتبر و مؤثر پیشگویی كننده شهرتی را كسب كرده است، عملكرد پردازش آن، قابلیت سنجش آن و برای تائید شرایط اصلی پردازش كارت اعتباری كافی میباشد.
دسترسی به داده ها ، ساخت و پیش پردازش . محصول DMW ، بطور مسقیم فایلهای ASCII با طول ثابت را تقویت میكند . محصول حمل میشود و با DDMS/COPY تركیب میشود (شركت نرم افزار تصویر ).
این ابزار میتواند DBMS اصلی فورمتهای آماری و صفحة گسترده را در یك فورمت ASCII با طول ثابت مناسب برایDMW را تبدیل نماید.
قابلیتهای ساخت داده های DMW شامل موارد زیر میباشد:
· حذف متغیرها از یك مجموعه اطلاعاتی
· نوع متغیر تعریف شده توسط كاربر
· تعداد مقوله های تعیین شده توسط كاربر
· تابع عادی سازی داده های تعیین شده توسط كاربر
· تغییر شكل اتوماتیك متغیرهای مقوله ای به متغیرهای دوتایی
· جایگزینی داده های از دست رفته
· نمونه گیری اطلاعاتی انتخاب شده توسط كاربر
ضریب تغییر شكل داده های DMW تساویها را حفظ میكند كه پارامترهای شكل ، متغیرها و نوع اطلاعات تابع های عادی سازی نرمال، تعداد مقادیر بی نظیر و ارزشهای اختصاص یافته به داده های از دست رفته را توضیح میدهد.
تكنیكهای استخراح داده ها ، الگوریتم ، و كاربردها DMW یك الگوریم شبكة عصبی انتشار رو به عقب را بكار میبرد . یك كاربر میتواند تابع انتقال (آستانه ، منطقی ، خطی ، گواسیان عكس تانژانت ، یا تانژانت هیپربولیك)، حالت یادگیری و چندین پارامتر دیگر را مشخص كند .
DMW ، مدلهای پیشگویی كننده ای را برای مسائل طبقه بندی بر پیشگویی و مسائل پیش بینی ایجاد میكند . كاربرد تحلیلی اصلی آن، كشف كلاهبرداری ( طبقه بندی ) برای صنعت كارت اعتباری میباشد.
كار با ابزار . DMW یك انعطاف پذیری مهم در شناسایی مدل را ارائه میدهد . مدل را میتوان بطور دستی یا خودكار با تعریف معماری اصلی و پارامترهای توپولوژیكی ، مشخص نمود . در حالت اتوماتیك ، DMW میتواند با انجام یك تجزیه و تحلیل دسته بندی در حوزه متغیر ، متغیرهای پیشگویی كند تا مناسب را انتخاب نماید.
DMW ، دو تابع را برای تفسیر مدل ارائه میدهد : تجزیه و تحلیل حسایت و تابع كمك كه تك تك سكویی ها را توضیح میدهد. به عنوان مثال این تابع را میتوان برای توضیح این كه چرا كاربر وام رد شد و عوامل رد تا چه حد قوی بودند مورد استفاده قرار دارد.
برای هر مدل ، DMW یك فایل لوگ و فایل مسابقه را ایجاد میكند كه حاوی اطلاعاتی در مورد این كه چه تعداد ارزیابی انجام شد، آمار ارزیابی و جداول پیشگویی های صحیح در برابر پیشگویی های نادرست میباشد . نتایج ارزیابی را میتوان در یك صفحه گسترده اكسل برای تجزیه و تحلیل معاملات كارت اعتبای مورد استفاده قرار داد. اگر چه DMW نمیتواند مستقیماً بانك های اطلاعاتی را امتیازدهی نماید، آن یك API موسوم به Deploy Net را برای صف بندی مدلهای ساخته شده با DMW ،ارائه مینماید.
نتیجه گیری . DMW یك محصول كامل و قوی است و در پذیرش بازار، بسیار موفقیت آمیز بوده است. كاربرد طبقه بندی / كشف كلاهبرداری آن در زمان واقعی برای تجزیه و تحلیل معاملات كارت اعتباری مورد استفاده قرار میگیرد. این یك شاهد قوی برای قابلیت سنجش و عملكرد محصول میباشد.
کلمات کلیدی : بازار استخراج داده ها;صفات و اسلوب شناسی ها;اصول طبقه بندی ابزارهای استخراج داده ها

بازدید : 54 نفر
فرمت : doc
سایز : 397 کیلو بایت
صفحات : 83