نقطه تقسیم بهینه جایی است که بیشترین مقدار را در بین تمام نقاط تقسیم در گره t داشته باشد. به طور کلی CART به صورت بازگشتی تمام نقاط تقسیم باقی مانده را ملاقات کرده و تابع فوق را برای یافتن نقطه تقسیم بهینه در هر گره اجرا می نماید. در نهایت هیچ گره تصمیمی باقی نمی ماند و درخت به طور کامل توسعه می یابد. البته ممکن است تمامی گره ها همگن نباشد که منجر به نوع خاصی از خطای طبقه بندی خواهد شد.
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
هم چنین در الگوریتم CART عملیات هرس کردن گره ها و شاخه ها انجام می گردد تا قابلیت تعمیم نتایج طبقه بندی افزایش یابد. هر چند که درخت کاملا توسعه یافته پایین ترین نرخ خطا را در مجموعه آموزشی دارد ولی مدل نهایی ساخته شده بر اساس آن ممکن است بسیار پیچیده شود. با توسعه هر گره تصمیم، زیر مجموعه رکوردهای موجود برای تجزیه و تحلیل کوچکتر شده و محدوده کمتری از جمعیت را شامل می شود. بنابراین هرس نمودن درخت، باعث عمومیت یافتن نتایج خواهد شد(Larsed 2003).
الگوریتم درخت تصمیم C4.5
الگوریتم C4.5 از نسل الگوریتم ID3 برای تولید درخت تصمیم است که از قانون هرس استفاده می کند. دقیقا مشابه الگوریتم CART، الگوریتم C4.5 نیز به صورت بازگشتی هر گره تصمیم را ملاقات کرده و نقطه تقسیم بهینه را انتخاب می کند تا جایی که دیگر انشعاب امکان پذیر نباشد. با این حال، تفاوت های جالبی بین CART و C4.5 وجود دارد(Larsed 2003).
الگوریتم C4.5 به تقسیم های دودویی محدود نمی باشد و قادر است درخت های با شاخه های بیشتر را تولید نماید. در این الگوریتم به طور پیش فرض برای هر یک از مقادیر صفات یک شاخه تولید می شود. از آن جا که ممکن است تعداد تکرار برخی از مقادیر کم باشد، در مواردی منجر به ایجاد درختی انبوه و بزرگتر از آن چه مورد نظر بوده می گردد که با بهره گرفتن از هرس سعی می شود درخت کوچکتر شده و این مشکل برطرف گردد. حتی اگر هیچ خطایی در داده های آموزشی وجود نداشته باشد باز هم هرس انجام می شود که این امر باعث
می شود درخت عام تر شده و وابستگی کمتری به مجموعه آموزشی داشته باشد.
الگوریتم C4.5 توانایی کار با داده ها و صفات پیوسته، گسسته، صفات فاقد مقدار و داده های نویزی را دارد. این الگوریتم بهترین صفت را با بهره گرفتن از معیار بی نظمی انتخاب می کند و به دلیل استفاده از عامل Gain Ratio قادر به بکارگیری صفات با مقادیر بسیار زیاد می باشد(Wu, Kumar 2006).
کلید ساختن درخت تصمیم در الگوریتم C4.5 این است که کدام صفت برای تقسیم استفاده شود. اکتشاف و ابتکار در این الگوریتم برای انتخاب صفت به صورت حداکثر بهره اطلاعات است. الگوریتم C4.5 از مفهوم دستیابی اطلاعاتGain Information یا کاهش آنتروپی ( بی نظمی) برای انتخاب تقسیم بهینه استفاده می نماید. آنتروپی آندازه گیری ناخالصی یا بی نظمی مجموعه داده D است. هرچه داده ها خالص تر و خاص تر باشد آنتروپی کوچک تر بوده و در واقع آنتروپی زیاد به معنی اطلاعات کم است. در آنتروپی، بیت واحد اطلاعات است. در واقع بیت ها نمادهای حامل اطلاعات هستند، نه خود اطلاعات.
m
Entropy (D) = -å Pi log2(Pi )
i=1
m تعداد کلاس های موجود است و pi احتمال آن است که یک متغیر دلخواه در D متعلق به کلاس Ci باشد که این احتمال به صورت |Ci,D|/|D| تخمین زده می شود. ( |D|و |Ci,D| تعداد رخداد در D و Ci,D را نشان می دهد)
فرض می کنیم صفت A دارای v مقدار متمایز به صورت {a1, a2, … ,av} باشد یا به عبارت دیگر A یک صفت گسسته است. اگر بخواهیم D را برحسب صفت A تقسیم کنیم v بخش یا زیرمجموعه مانند {D1,D2,….Dv} حاصل می شود. آنتروپی مورد انتظار اگر Ai به عنوان ریشه به کاربرده شود برابر است با:
EntropyA (D)=|Dj|/|D|* Entropy(Dj )
اطلاعات حاصل از انشعاب بر حسب صفت A را به صورت زیر تعریف می کنیم:
[Gain(A) = Entropy(D)-EntropyA(D))]
هرچه مقدار بهره صفت A یعنی (GainA) بیشتر باشد یا به عبارت دیگر هرچه (Entropy D) کمتر باشد، صفتA گزینه مناسب تری برای انتخاب به عنوان صفت تقسیم می شود.
الگوریتم های شبکه های بیزین
در برخی از الگوریتم های طبقه بندی تعدادی شی موجود است که همگی دارای یک بردار از خصیصه ها می باشند. مدل شبکه بیزین یک مدل بر مبنای احتمال است که رویدادهای مشاهده شده و ذخیره شده را بررسی کرده و مشابهت رویدادها را با بهره گرفتن از خصیصه های به ظاهر نامشابه تعیین می کند. شبکه بیزین یک مدل گرافیکی است که متغیرها در یک مجموعه داده[۴۴] را به صورت گره[۴۵] نشان داده و احتمال یا شرط استقلال بین آن ها را بیان می کند. ارتباط سببی ( علی) بین گره ها هم می تواند توسط شبکه بیزین نمایش داده شود.
هم چنین خطوط[۴۶] شبکه لزوماً ارتباط یا تاثیرهای مستقیم بین متغیرها را نشان نمی دهد. در صورتی که مقادیر گم شده[۴۷] در داده ها زیاد باشد، این نوع شبکه بسیار بزرگ و گسترده شده و بهترین پیش بنی ممکن را با بهره گرفتن از اطلاعات موجود ارائه می دهد(Wu, Kumar 2006).
در این مدل ابتدا فرض می شود که هر شی به یکی از کلاس های مشخص متعلق است. سپس احتمال درست بودن این فرضیه محاسبه می شود. برای این کار تمامی اشیا یک بار پویش شده و با توجه به داده های آموزشی صحت احتمال منظور شده به طور قابل توجهی افزایش یا کاهش می یابد. هدف استخراج قواعدی است که بر اساس ن ها بتوان با دادن خصیصه های یک شی کلاس آن را تعیین نمود.
الگوریتم بیزین با توجه به سادگی پیاده سازی وعدم نیاز به روش های پیچیده برای تخمین پارامترهای تکراری مورد توجه می باشد. این ویژگی ها بدین معنی است که به راحتی بر روی داده های بسیار بزرگ اعمال می شود و به دلیل امکان تفسیر و تحلیل ساده، کاربران غیر متخصص نیز می توانند دلایل طبقه بندی انجام شده توسط این کاربر را درک نماید.
در این الگوریتم Ci کلاس های تعریف شده و X شی مورد نظر است که تعدادی خصیصه دارد.
احتمال های زیر برای اجرای مدل محاسبه می گردد:
P(ci|x): احتمال این که شی x متعلق به کلاس ci باشد.
P(x|ci): احتمال این که در صورتی که شی x متعلق به کلاس ci باشد، مقادیر خصیصه های آن برای ساخت قواعدی انتخاب شود.
P(ci ): احتمال این که هر شی متعلق به کلاس ci باشد.
P(x): احتمال این که مقادیر خصیصه های شی x بدون توجه به کلاس آن برای ساخت قواعد انتخاب شود.
فرضیه الگوریتم بیزین بر اساس فرمول زیر می باشد:
P(ci|x)=P(x|ci) P(ci) / P(x)
مدیریت شهری و شهرداری
چالش شهری در هیچ جای دنیا به اندازه ی آسیا مشهود نمیباشد. امروزه ۳۸ درصد از جمعیت این ناحیه در شهرها زندگی میکنند، این نسبت اکنون در ایران حدود ۷۰ درصد میباشد و پیشبینی میشود تا سال ۲۰۲۰ این مقدار از ۸۰ درصد فراتر رود. متخصصان شهری اکنون پدیده ی جدیدی را در بین این کلانشهرها شناسایی کردهاند؛ انباشت و تراکم انبوهی از شهرها با اندازههای مختلف که قبلاً به صورت مجزا بودهاند ولی هم چنان هویت فیزیکی خود را حفظ نمودهاند، رویهم انبوهی از جمعیت ۲۰ و حتی ۳۰ میلیون نفری را به صورت شبکهای بهوجود میآورند؛ به عنوان مثال منطقه ی شهری تهران که شامل شهرهای تهران، ری، اسلامشهر، شمیرانات، شهریار، رباطکریم و کرج میباشد، همگی با وجود حفظ بافت کهن خود به همدیگر چسبیدهاند. در تعدادی از این شهرها، پیشبینی میشود که مسائلی از قبیل عرضه ی خدمات پایه، طی مسافت از خانه تا محل کار و دفع ضایعات و زبالهها که تا کنون بسیار معضلآفرین بودهاند در دهه های آتی چندین برابر افزایش یابند(وست فال و دویلا،۱۳۸۶، صص۱و۲).
گستردگی و پیچیدگی مسائل شهری و رشد و توسعه ی روزافزون شهرها، مدیریت امور شهر را به وظیفه ای دشوار تبدیل نموده است. علاوه بر موضوعاتی هم چون محیط زیست، حمل و نقل، ایمنی و برنامه ریزی شهری، یکی از عوامل مهمی که تأثیر فزاینده و تعیین کننده ای بر عوامل سازنده ی شهری دارد، مدیریت شهری است. اگر شهر هم چون سازمانی در نظر گرفته شود، لازم است که در رأس آن عنصری برای برنامه ریزی آینده و اداره ی امور کنونی قرار گیرد. این عنصر را میتوان مدیریت شهر نامید. مسائل بسیاری در شهرها وجود دارد که برای حل آن ها و پاسخ به درخواستهای موجود در عرصه های زندگی جمعی، وجود مدیریت شهری را ضروری مینماید. این موضوع به خصوص در مسائل خدماتی و عمرانی عمومی، جنبه ی ویژه پیدا می کند. لذا اموری مانند تأمین بهداشت و نظافت محیط شهر، ایجاد و حفظ فضای سبز، تأمین ایمنی شهر و شهروندان، نیازمند وجود سازمانی با تشکیلات مشخص است تا مدیریت شهر به نحو مطلوب صورت گیرد. بدینسان مدیریت شهری به معنای سازماندهی عوامل و منابع برای پاسخگوئی به نیازهای ساکنان شهر است و شامل کارکردهای برنامه ریزی، اجرا، نظارت، کنترل و هدایت است که برای اعمال قدرت باید برآمده از اراده ی شهروندان و قراردادهای اجتماعی باشد (نظریان آزاد، ۱۳۸۸، ص۴).
همان طور که بیان شد، امروزه شهرنشینی و توسعه ی شهری یکی از پدیده های ویژه است. رشد سریع شهرها و پیشی گرفتن آن از توانائیها و منابع مدیران شهری، ارائه ی خدمات شهری مناسب را برای مدیران شهری به یک چالش عظیم تبدیل نموده است. تراکم جمعیت، دشواری رفت و آمد در محیطهای شهری، آلودگیهای هوا و ناامنیهای اجتماعی، برخی از مشکلاتی است که ذهن کارشناسان و صاحبنظران در حوزه های مختلف را به خود مشغول نموده است. در این خصوص، به منظور کاهش و برطرف نمودن مشکلات یاد شده، توسعه ی فن آوری اطلاعات و ارتباطات مدنظر قرار گرفته است. (نظریان آزاد، ۱۳۸۸، ص۱).
ترادف مفهوم مدیریت شهری به رغم ماهیت آن با مفهوم شهرداری به عنوان سازمان مدیریت شهری، ناگزیر میسازد تا به مفهوم شهرداری نیز پرداخته شود.
برابر ماده ۵ قانون محاسبات عمومی کشور نیز «شهرداری سازمانی است عمومی و غیردولتی که دارای شخصیت و استقلال حقوقی بوده و تحت نظارت شورای شهر که منتخب مردم است و نظارت دولت از طریق وزارت کشور برای انجام وظایفی که در قانون شهرداری ها آمده است، تأسیس شده است. » با توجه به تعاریف ذکر شده میتوان گفت تعریف مدیریت شهری( با توجه به دیدگاهی که آن را مساوی با شهرداری میگیرد) عبارت است از اداره سازمانی غیردولتی که برای برآورده کردن نیازهای مشترک شهروندان در سطح شهر از طرف آن ها و مطابق با قانون تأسیس میگردد و در محدوده فعالیت خود استقلال سازمانی دارد(خانزاده، ۱۳۸۶، ص ۷۶).
نقش فن آوری اطلاعات در توسعه ی مدیریت شهری
در دو دهه اخیر، واژه فن آوری اطلاعات یا فن آوری اطلاعات و ارتباطات به عنوان یک پدیده ی نوظهور و قدرتمند، جایگاه جهانی خود را پیدا کرده است و به نظر میرسد به زودی کاربردهای مختلف آن، تمام امور روزمره جوامع را- به صورت مستقیم و یا غیر مستقیم _ تحت تأثیر خود قرار دهد. سرعت تأثیرگذاری و گسترش این پدیده بسیار زیاد است به طوری که از هم اکنون انتظار میرود در ساختارهای فرهنگی، اقتصادی، اجتماعی و سیاسی و هم چنین در بنیانهای سنتی اداره جوامع، تحولات اساسی رخ دهد و سیستم جدیدی از مدیریت معرفی گردد..
بیشتر کشورهای توسعه یافته منافع و خطرهای احتمالی فن آوری اطلاعات و ارتباطات و کاربردهای آن را پذیرفتهاند و از آن استفاده می کنند. بعضی از کشورهای در حال توسعه و یا فقیر نیز که در خصوص مزایا و فرصتهای این فن آوری اطلاعات کافی ندارند و یا از امکانات اقتصادی لازم برای به کارگیری این پدیده بیبهره هستند، در این زمینه دچار عقبماندگی شده اند. کشورهائی نیز وجود دارند که از نظر مالی مشکل خاصی ندارند، اما با رویکردی ایدوئولوژیک به این پدیده ی نوظهور نگاه می کنند و باعث تأخیر و یا مانع استفاده مردم کشور خود میشوند. متأسفانه این رویکرد موجب می شود خسارات جبرانناپذیری به جامعه تحمیل گردد. از آنجا که تمام ابعاد این پدیده ( و به خصوص بعضی از کاربردهای آن مانند شهر الکترونیکی) حتی در بعضی از کشورهای توسعه یافته نیز شناخته شده نیست. بنابراین، فرهنگسازی و آسیب شناسی در زمینه معرفی فن آوری اطلاعات و ارتباطات و کاربردهای آن اقدام موثّری محسوب می شود(جلالی، ۱۳۸۴).
به کارگیری فن آوری اطلاعات و ارتباطات در اداره ی امور شهر هم از دیدگاه شهروندان و هم از دیدگاه مدیران شهری دارای مزایای فراوانی است که برخی از آن ها عبارتند از(محکی، ۱۳۸۶، ص ۷۷):
-
- از دیدگاه مدیران شهری
-
- شناسایی بهتر مشکلات و نقاط ضعف شهر.
-
- افزایش قدرت کنترل و نظارت بر شهر.
-
- تقویت رقابت تجاری شهر و ایجاد فرصتهای تجاری بیشتر توسط تجارت الکترونیک.
- ارتباط بهتر سازمانها و ارگانهای مختلف شهری.