کیفیت و پاک سازی داده ها و راهکارهای بهبود آن در پایگاه های داده
استفاده از Gs1 در سیستم پیشنهادی اطلاعاتی و کمک فناوری اطلاعات
کیفیت و پاک سازی داده ها و راهکارهای بهبود آن در پایگاه های داده |
چکيده
دادهها بين طرفهاي تجاري يا در داخل هر شرکت و سازماني جريان دارند. دادههاي مهمي که در اغلب سازمانها وجود دارند مربوط به اشخاص حقيقي، اشخاص حقوقي، کالاها، خدمات و مكانها هستند. براي کار با اين دادهها (پردازش، تبادل، استفاده و غیره) نياز به تهيه مشخصات کاملي از هر قلم داده است و معمولاً اين مشخصهها در يک فهرست يا انبار داده ذخيره ميشود. مهمترین دادههاي مرتبط با هر قلم، دادههاي اساسي يا دادههايي درباره دادههاست. اگر Master Data ها به درستي بررسي، کنترل و پاکسازی نشوند، در تبادل دادهها و انتقال درست و كامل و بدون ابهام مفاهيم مورد نظر با مشکل مواجه خواهيم شد و این مسئله هزينههايي را به سازمان تحميل ميکند. بايد در هر جايي که دادهها وجود دارند به مقوله کيفيت و پاکسازی آنها چه از نظر معنايي و چه از نظري دستوري و نگارشي توجه شود. چراکه کيفيت دادهها داراي ارتباط مستقيم با هزينههاي سازماني است.
دادهها بين هر موسسه و ديگر طرفهاي کاري يا تجارياش مانند بانک، بيمه، تأمینکنندگان، مشتريان و … تبادل میشوند. اين تبادل وقتي ميتواند درست و بینقص انجام شود كه دادههاي اساسي، باكيفيت و پاکسازی شده نزد هر دو طرف مبادله موجود باشد، چراکه بيکيفيتي دادهها، ارتباط مؤسسات را با هم سخت، پرهزينه و پراشتباه ميکند. لذا ضروري است تا تدابير لازم براي پاکسازی و بهبود كيفيت دادهها در پايگاههاي داده كشور اتخاذ شود. در اين مقاله يك راهكار عملي براي اين منظور ارائه شده است.
1- مقدمه
در هر نظام اقتصادي و اجتماعي، مراكز و واحدهاي مختلفي وجود دارند كه كالاها و خدمات متنوع و متعددي را تأمین نموده و به ديگران عرضه ميكنند. اين مراكز و واحدها كه ما آنها را مؤسسات تأمینکننده يا عرضه كننده ميناميم؛ شامل تعداد بسيار زيادي سازمان، اداره، شركت، كارگاه، واحد صنفي، مغازه، دفتر، انجمن، گروه و حتي افرادي ميشود كه در قالب زنجيرههاي مختلف، كالاها و خدمات متنوعي را از مبدأ (به صورت ماده خام اوليه) تا مقصد (استفادهكننده نهايي) تأمین مينمايند. در همه اين مؤسسات، دادهها و اطلاعات در كنار ساير عوامل توليد، نقش تعيينكنندهاي دارند. اين دادهها، اغلب در سیستمهای اطلاعاتي يك موسسه يا بين چندين موسسه گردش دارند .
اغلب سیستمهای اطلاعاتي نمايشي از دنياي واقعي در درون کامپيوترها هستند. در سیستمهای اطلاعاتي از دادهها به عنوان خون سيستم نام برده ميشود بنابراين کارآمدی سیستمهای اطلاعاتي در درجه اول به دادههاي درون آنها بستگي دارد. امروزه مفاهيمي چون انبار دادهها در سیستمهای اطلاعاتي مطرح شدهاند. اين انبارهاي داده زماني ميتوانند سبب بهبود كارها شده و به درستي عمل کنند که دادههاي درون آنها از یک طرف بین سازمانهای مختلف هماهنگ و همسان بوده و از طرف دیگر از کيفيت و ساختاردهی مناسبي برخوردار باشند. همانگونه که دادههای درست و باکيفيت در سیستمهای اطلاعاتي تأثیر مثبت و سازندهای دارند، دادههای بيکيفيت و غلط يا ناهماهنگ به همان اندازه تأثیر منفي و تخريبکنندهاي در عمليات سازمان به جاي ميگذارند.
به عنوان يك اصل كلي ميتوان گفت كه «دادهها بايد با موارد کاربردشان در عمليات، تصميمگيري و برنامهريزي سازگار و مطابق باشند.» علاوه بر آن، دادههايي را داراي کيفيت و پاك ميدانند كه به طور صحيح يك تصوير مناسب از واقعيت منعکس کنند. اين تصوير واقعي در خلأ شكل نميگيرد و تابع قواعدي است كه توسط بشر براي ريختن مفاهيم در قالب اجزاء حامل داده مانند كلمات و عبارات و شمارهها و علائم وضع شده و به كار بسته میشود.
هدف اين مقاله ارائه مدلي کاربردی جهت بررسی نحوه توليد، ثبت، جريان و گردش دادههاي مختلف در كشور به منظور بهبود کیفیت و پاکسازی دادههایی است که در کشور بین بنگاهها و سازمانهای مختلف مبادله ميشود. اين موضوع از آن رو اهميت دارد كه موفقيت در مبادله دادهها با روشهاي الكترونيكي نظير EDI و XML و برخورداري از مزاياي آنها، به شدت به كيفيت و پاکسازی دادهها و سازگاري آنها بين همه متعاملين بستگي دارد.
2- تعريف مسئله و ضرورت انجام تحقيق
در کشور سازمانها و مؤسسات مختلفی ازجمله شرکتهای تولیدی و توزیعی، شرکتهای واردکننده، شرکتهای خدماتی، وزارتخانههای مختلف و زیرمجموعههای آنها، نیروهای مسلح و دستگاههای دولتی و غیردولتی دیگری در بخشهای مختلف فعالیت میکنند. بدون شک دادههاي فراواني بین این سازمانها مبادله ميشود. به عنوان مثال میتوان به دادههایی که بین عناصر مختلف یک زنجیره تأمین شامل تأمینکننده مواد اولیه، تولیدکننده، توزیعکننده، خردهفروش و مصرفکننده مبادله میشود، اشاره کرد. در حال حاضر هر کدام از این سازمانها و مؤسسات با توجه به سلیقه و دیدگاه خود استانداردهای دادهای خاصی برای دادههاي خود تعریف کرده و مورد استفاده قرار میدهند. این مسئله باعث میشود که در هنگام تبادل دادهها بین سازمانهای مختلف دو مسئله اساسی زیر مطرح شود:
– عدم وجود یک استاندارد یکسان و هماهنگ از دادهها
– پایین بودن کیفیت دادهها از نظر معنایی (semantic) و دستوری (syntactic)
این دو مسئله باعث میشود از میزان دقت، صحت، یکپارچگی و جامعیت دادهها به میزان قابلتوجهی کاسته شده و در بسياري مواقع به دليل بيکيفيت بودن دادهها هزينههاي زيادي بر سیستمها تحميل شده و زمان لازم برای تصفيه و بازخوانی دادهها افزايش یابد. همانطور که گفته شد عمده اين هزینهها به دليل عدم وجود يک استاندارد هماهنگ براي کد نمودن دادههای مربوط به يک قلم و ارائه مشخصات جامعی از اقلام مورد نظر به همراه تعریف دقیق ارزش مشخصههاي آنهاست.
در ادامه مسئله را با یک مثال روشنتر میکنیم، تولیدکننده یک ماژیک را در نظر میگیریم که در بانک دادههای خود و یا بر روی کالای تولیدی خود مشخصات زیر را که از دیدگاه خودش دارای اهمیت است، درج میکند:
– ماژیک وایتبرد با طول cm10، رنگ آبی و وزن g50
ممکن است خریدار و یا تولیدکننده دیگری و هر سازمان دیگری که با این تولیدکننده تبادل داده دارد، اجزاء داده دیگری از ماژیک مانند وضعیت نوک ماژیک از نظر تخت یا گرد بودن آن را در بانکهای داده خود ثبت کنند و یا برای آنها حائز اهمیت باشد؛ همچنین برای آنها دقیقاً معلوم نیست که طول یا وزن مورد نظر این تولیدکننده با درب ماژیک است یا بدون درب آن و یا منظور از cm در سیستم SI است یا سیستم دیگر.
در چنین شرایطی به دلیل هماهنگ نبودن اقلام دادهای بین تولیدکنندگان مختلف و یا خریداران آنها از کیفیت دادهها کاسته شده و تبادل اطلاعات هزینههای اضافی را بر آنها تحمیل میکند؛ بنابراین باید استاندارهایی را تعریف کرد که تمامی اقلام داده بر اساس آنها هماهنگ شوند و از این طریق بین سازمانها مختلف یک زبان مشترک براي تبادل دادهها ایجاد کرد.
به طور خلاصه میتوان گفت، مسئله اصلي کنوني این است که دادههایی که در کل اسناد در گردش در سطح ملی درج و مبادله میشوند، ناهماهنگ و در برخي از موارد دچار بيکيفيتي است که در این پژوهش به دنبال راهحلهایی برای پاکسازی و بهبود كيفيت دادهها هستیم. چراکه این مسئله ارتباط مؤسسات را با هم سخت، پرهزينه و پراشتباه ميکند.
3- سؤالات تحقیق
سؤالات تحقيق را ميتوان به صورت زير مطرح نمود:
1- آیا هماکنون دادههای اساسی موجود در کشور که بین سازمانها و مؤسسات مختلف یا بین سازمانها و افراد حقیقی در تبادل هستند دارای کیفیت لازم هستند؟
2- آيا سیستمهای کیفیت دادهها ميتوانند نقشي مؤثر و کارآمد در شفافسازی تبادل اطلاعات ایفا نماید؟
3- مکانیسم بهبود کیفیت دادهها در کشور چیست؟
4- اهميت كيفيت دادهها در سازمان
يكي از موضوعات بسيار مهم در هر سامانه يا پايگاه اطلاعاتي، كيفيت دادههایی است كه در آن پايگاه اطلاعاتي ثبت و نگهداري ميشود. اهميت روزافزون اين موضوع در دنيا تا حدي است كه به دنبال مطرح شدن استانداردهاي جهاني ايزو 9000 براي مديريت كيفيت، ايزو 14000 براي مديريت زیستمحیطی، ايزو 27000 براي امنيت پایگاههای اطلاعاتي يك سري از استانداردها با شماره ايزو 8000 براي كيفيت دادهها توسط سازمان جهاني استاندارد (ISO) تدوين و منتشر شده است. رعايت استانداردهاي ايزو 8000 در سازمانهایی كه خروجي اصلي آنها اطلاعات و دادههاست به ضرورتي انكارناپذير تبديل شده است.
به طور عملي، کيفيت دادهها يک دغدغه براي متخصصان درگير با يک محدوده وسيع از سیستمهای اطلاعاتي، محدودهای از دادههای انبار و هوش تجاري جهت مديريت روابط مشتري و مديريت زنجيره تأمین است. يک مطالعه صنعتي برآورد کرده که هزينه کل اقتصاد آمريکا از مسائل کيفيت دادهها بيش از 600 ميليون دلار در سال است. در واقع مسئله اين است که يک نگراني باعث شده تا شرکتها يک تيم بهبود دادهها را مسئول کيفيت دادهها نمايند. این موضوع اهمیت کيفيت دادهها/اطلاعات در سازمانها را نشان میدهد. مشکلات کيفيت دادهها تنها مربوط به دادههاي غیر صحیح نيست. دادههای متناقض و ناپايدار نيز مسئله ديگري است. حذف کردن سیستمهای حاشیه دادهها و متمرکز کردن دادهها در يک انبار داده يکي از ابتکارهاي يک شرکت است که میتواند از ثبات و پايداري دادهها مطمئن شوند .
هماکنون بازار به سوي راهي براي فراهم کردن تضمين کيفيت دادهها میرود. تعدادي از فروشندگان ابزارهايي براي تحليل و بازسازي و اصلاح کيفيت دادههاي ضعيف در محل فراهم کردند.
مسائل ناشي از پايين بودن كيفيت دادهها مشتمل بر سه مورد زير است:
1- چند زباني دادهها كه منجر به عدم امكان تعامل سيستمي به دليل چندگانگي تعاريف و استانداردهاي مربوط به دادهها میشود.
2- پایین بودن کیفیت دادهها از نظر معنایی و دستوری يا نحوي كه باعث میشود از میزان دقت، صحت، یکپارچگی و جامعیت دادهها به میزان قابلتوجهی کاسته شود.
3- پاك و خالص نبودن اطلاعات كه منجر به سردرگمي و احتمال خطا در تصميمگيري ميشود.
5- تاريخچه و تجارب جهانی
قبل از به وجود آمدن سیستمهای رایانهای ارزان، چارچوب اصلي کامپيوترهاي بزرگ براي نگهداري دادههای نام و آدرس به طوري که نامه بتواند به طور صحيح به مقصدش ارسال شود، استفاده ميشد. اين چارچوب اصلي در نقشهای تجاري جهت تصحيح غلطهای املايي معمول و غلطهای چاپي در اسم و آدرس دادهها استفاده شد، چنانچه براي رديابي مشترياني که جابجا شدهاند، مردهاند، زندان رفتهاند، ازدواج کردهاند، طلاق گرفتهاند يا ديگر حوادث تغيير زندگي را تجربه کردهاند، استفاده شد. آژانسهای دولتي شروع کردند تا دادههای پستي موجود را براي برخي از شرکتهای خدماتي به منظور ارتباط متقابل آنها با مشتريان، همراه با به روز کردن تغييرات در سطح ملی انجام دهند. اين تکنولوژي میلیونها دلار براي شرکتهای بزرگ در مقايسه با تصحيح دستي دادههاي مشتري صرفهجويي کرد .
شرکتها با تمرکز روي بازاريابي، اغلب تلاشهای کيفيشان روي اطلاعات نام و آدرس است، اما کيفيت دادهها به عنوان يک ويژگي مهم برای همه انواع دادهها شناخته ميشود. اصول کيفيت دادهها میتواند جهت دادههای زنجيره تأمین، دادههای تراکنشي و تقریباً هر طبقه ديگري از دادههايي که در سازمانها يافت میشود، بکار برده شود. براي مثال: ساختن دادههای زنجيره تأمین مطابق با يک استاندارد مشخص است که براي سازمان داراي ارزش است اين استاندارد موارد زير را به همراه دارد:
1) اجتناب از اضافه موجودي يکسان و مقدار کمي موجودي متمايز
2) بهبود شناخت از خريدهاي فروشنده براي کاهش حجم موجودی
3) اجتناب از هزینههای لجستيکي در بخشهای انبارداري و حملونقل در يک سازمان بزرگ.
امروز يک انگیزه در صنعت وجود دارد تا دادههای غیر آدرسی را نیز استاندارد کنند. گروه غيرانتفاعي GS1 در ميان گروههاي اين حرکت قرار دارد.
كميته فني 184 ايزو (TC184) نيز در زيركميته 4 خود به مقوله دادههای صنعتي (نه تجاري) ميپردازند. دو كارگروه این زیر کمیته با نامهای كيفيت دادهها و منابع مشترك (عمومي) تاكنون خروجيهايي در این زمینه داشتهاند. چندین کشور ازجمله: آمریکا، سوئد، سوسیس، آفریقای جنوبی، هلند، فرانسه، آلمان، چین، استرالیا، ژاپن و غیره با این زیر کمیته همکاری نموده و دادههای خود را استاندارد کردند. زیر کمیته 4 کمیته فنی 184 ایزو با همکاری این کشورها استانداردی را به نام ایزو 8000 برای کیفیت دادهها، استاندارد 22745 را برای ایجاد دیکشنری فنی باز برای دادههای اساسی و استاندارد 29002 را برای تبادل مشخصههای دادهها تعریف کردند که معماري كلي آن به شكل ذيل است :
هماکنون از چنین راه حلی برای بهبود کیفیت دادهها در سطح تجارت بینالمللی توسط انجمن مديريت كدهاي تجارت الكترونيكي (ECCMA) استفاده میشود.
دانشگاه MIT نيز يک برنامه مديريتي جامع کيفيت دادهها دارد که توسط پروفسور ريچارد وانگ ايجاد شده است. اين برنامه تعداد زيادي از انتشارات يک کنفرانس بينالمللي مشخص در اين زمينه را در خود جاي داده است.
نويسندگان و متخصصان زيادي وجود دارند که در زمينه کيفيت دادهها فعاليت میکنند. علاوه بر اين انجمنهاي بينالمللي براي کيفيت دادهها و اطلاعات (IAIDQ) در سال 2004 به وجود آمدهاند تا يک نقطه کانوني براي متخصصان و محققان در اين زمينه فراهم کنند.
6- مبانی نظری تحقیق
هدف نهایی این تحقیق ارائه مدلي براي رسیدن به درجه مطلوبی از کیفیت دادههایی است که بین سازمانها و مؤسسات مختلف در کشور مبادله میشوند. در این قسمت به بررسی مبانی نظری و ادبیات کیفیت و پاکسازی دادهها پرداخته شده است.
6-1 . كيفيت دادهها
درک جوهره کیفیت دادهها برای تشخیص و مدیریت فرایند پاکسازی آنها بسیار حائز اهمیت است. هر روز ما با انواع مختلفي از دادهها سروکار داريم، به طور ساده از يك نام کاربری و کلمه عبور گرفته تا ترس و نگراني ما از برگشت خوردن ماليات ساليانه و هر چیزی دراینبین از توافقنامه اجاره مسكن تا نامنويسي و اتاق گرفتن در يك هتل، دادههايي را طلب نموده و درخواست ميكنند. در هر يك از اين موارد، نياز به ارائه دادههایی هست که نیازمنديهايي را برآورده ميكنند. دادهها در پشتيباني و تسهيل فعاليتهاي کاري، ايجاد امکان دسترسی به رایانه، وبسایت و یا یک برنامه نرمافزاری و تطابق با مقررات مورد نياز هستند و به سادگي اطلاعات لازم جهت تهيه محصول یا خدمت درست و یا پرداخت هزینه آن را فراهم میکنند. نیازمندیها و الزامات مربوط به یک فعاليت در کسبوکار پديدار میشود و کاملاً روشن است كه میتواند از یک کسبوکار به کسبوکار دیگر و از یک سازمان به سازمان دیگر و همچنین در زمانهاي مختلف تغییر کند. تا زمانی که دادهها پاسخگوی نیازها باشند، به عنوان دادههاي باكيفيت تلقي ميشوند.
چيزي كه به خاطر سپردن آن مهم است این است که دادههای باکیفیت، دادههایی هستند که نیازها را برآورده نمايند، نه بیشتر و نه کمتر. کیفیت دادهها بیش از برآورده ساختن نیازها افزایش نمییابد، در واقع تنها كم بودن کیفیت آنها ميتواند مورد توجه قرار گيرد همانطور که سروصدای اضافي میتواند کیفیت موسیقی را کاهش دهد.
تعاريف مختلفی از کیفیت دادهها ارائه شده که در ادامه به چند مورد اشاره میشود.
1- کيفيت دادهها به درجه خوب بودن ارائه دادهها در توصيف يک پديده واقعي اطلاق ميشود.
2- حالتي از تماميت، اعتبار، پايداري و ثبات (سازگاري)، به موقع بودن و دقت که دادههاي مناسب براي يک مورد استفاده خاص را میسازد.
3- فرايندها و تکنولوژيهايي که به دنبال تطبیق ارزش دادهها براي نيازهاي تجاري و معيارهاي قابل قبول هستند.
همچنين به فرآیند ايجاد دادههای باکیفیت، پاکسازی دادهها يا تمیز کردن دادهها ميگويند. به عبارتي پاکسازی (تمیز کردن) صنعتي، شامل ساختاردهی به دادهها و همچنین افزودن دادههای مفقود و از دست رفته است.
تعدادي چارچوبهاي نظري براي ادراک کيفيت دادهها وجود دارد. ديدگاه نظري سيستمها، متأثر شده از مصلحتگراهاي آمريکايي، تعريف کيفيت دادهها را براي در برگرفتن کيفيت اطلاعات گسترش داد و بر جامعيت ابعاد بنيادي، دقت و صحت بر اساس تئوري علمي تأکید کرد. يک چارچوب به دنبال يکپارچگي چشمانداز کالا و خدمت است. ديگر چارچوب در نمادشناسي براي ارزيابي کيفيت، فرمت، مفهوم و استفاده از دادهها بنا نهاده شده است. يک ديدگاه تئوري دیگر میزان خوب بودن طبيعت ذاتي سیستمهای اطلاعاتي براي تعريف کيفيت دادهها را آناليز میکند.
مقدار قابلتوجهي از کيفيت دادهها به بررسي و توصيف طبقههاي متنوعي از خواص مطلوب و خوشايند دادهها میپردازد. اين ليستها به طور عادي دقت، صحت و درستي، انتشار، تماميت و ارتباط را شامل میشود.
6-2 . اصول کيفيت دادهها
تجربه نشان داده است که نگرش به دادهها به عنوان دارايي درازمدت و مديريت کردن آنها در يک چارچوب هماهنگ، صرفهجویی قابلتوجه و ارزش مداومي به وجود ميآورد.
اصول کيفيت دادهها نياز دارد تا در تمام مراحل فرايند مديريت دادهها ازجمله: گردآوري، طبقهبندي، ذخيرهسازي، تحليل، ارائه و استفاده بکار گرفته شود. براي بهبود کيفيت دادهها دو مسئله کليدي وجود دارد که عبارتاند از پيشگيري و تصحيح. پيشگيري از اشتباه با جمعآوری دادهها و وارد کردن آنها در پايگاه دادهها وابسته است. اگرچه تلاش قابلتوجهي براي جلوگيري از اشتباه میتواند و بايد بکار گرفته شود، ولي واقعيت اين است که اشتباهها در مجموعههای داده بزرگ ادامه خواهد داشت و اعتباربخشي و تصحيح دادهها نمیتواند ناديده گرفته شود.
6-3 . چشمانداز کيفيت دادهها (Vision)
براي سازمانها مهم است که چشمانداز روشني از کيفيت دادهها داشته باشند. اين مورد مخصوصاً در سازمانهایی که دادههايي را براي ارسال به ديگر سازمانها طراحي ميکنند وجود دارد.
چشمانداز کيفيت دادهها شامل موارد زير است:
- تمرکز سازمان جهت انديشيدن پيرامون نيازهاي کيفيت دادهها و اطلاعات بلند مدت و ارتباط آنها جهت موفقیتهای بلند مدت سازمان
- تشويق رفتارها و عمليات در مسير مستقيم يعني به سمت کيفيت
- فراهم کردن روشي اساسي براي تصميمگيري هم در داخل سازمان هم در خارج سازمان
- رسمي کردن شناسايي دادهها و اطلاعات به عنوان سرمایههای اصلي سازمانها
- حداکثر کردن استفاده از اطلاعات و دادههای سازمان، اجتناب از تکرار و تسهيل مشارکت
- افزايش يکپارچگي و تعامل با سازمانها
6-4 . سياست کيفيت دادهها
علاوه بر چشمانداز، سازمان نيازمند سياستي براي اجراي آن چشمانداز است. توسعه شعار سياست کيفيت دادهها نيز همینطور است:
- مجبور کردن سازمان براي تفکر بيشتر و وسيع در مورد کيفيت دادهها
- رسمي کردن فرايندهاي مديريت دادهها
- کمک کردن به سازمان در روشنتر شدن اهدافش با توجه به:
- کاهش هزينه ها
- بهبود کيفيت داده ها
- بهبود خدمت و ارتباطات مشتري
- بهبود فرايند تصميم گيري
- بهبود روابط و ارتباطات با اربابرجوع (هم فراهمکنندگان دادهها و هم استفاده کنندگان دادهها)
- توسعه ايستادگي و دوام سازمان در انجمنهاي بزرگتر
- بهبود شانس هاي سرمايه گذاري بيشتر
7- چرا به داده های پاک نياز داريم؟
پاسخ اساسی این است که ما به پاکسازی دادهها زمانی که دادهها جوابگوی نیازهای ما نیستند، نیاز داریم. به طور مشخص زمانی که دادهها جمعآوری شدند، براي برآورده شدن نيازمنديهاي خاصي اين جمعآوري انجام شده است اما در محیطهای كاري امروزي ما تلاشهای زیادی برای حداقل کردن ورود و ثبت دادهها انجام میدهیم. این بدان معنی است که دادههای جمعآوری شده برای پشتیبانی یک فرایند تجاری باید در فرایند تجاری دیگر قابل استفاده مجدد باشند. دادههایی که در طول یک کسبوکار قابل استفاده مجدد هستند، معمولاً دادههای اصلی (Master Data) نامیده میشوند.
دادههای اصلی نه تنها براي اينكه دوباره قابل استفاده هستند، اهميت دارند، بلكه به خاطر اينكه در تراكنشهاي انجام کار به عنوان دادههاي مرجع مورد استفاده قرار ميگيرند نيز مهماند، بنابراين داشتن دادههای اصلي جامع و بهروز بسيار مهم است. يكي از متداولترين تراكنشهاي انجام کار، تراكنش با يك كارت اعتباري است. اگر زماني كه يك فروشنده، كارت اعتباري شما را از دستگاه كارتخوان به سرعت عبور دهد به دادههاي ايجاد شده توجه كنيد، متوجه تاريخ و مبلغ مربوطه خواهيد شد، اما دو كليد ارجاع به دادههای اصلی هم هست كه يكي شماره كارت اعتباري شما و ديگري شماره حساب فروشنده است. هر دوي اين شمارهها، شناسههاي (مرجع) مربوط به دادههای اصلی است كه براي انجام تراكنش مورد نياز هستند. هر دو شماره مرجع ميتواند همچنين به عنوان شناساگر استفاده شوند، شماره كارت اعتباري شما معرف شما و شماره حساب فروشنده نيز معرف فروشنده است. این واقعيت كه «ميتواند براي هدف ديگري استفاده شود» بر اين فرض استوار است كه دادههاي جمعآوري شده براي يك هدف مشخص، ممكن است نيازمنديهاي ديگري را هم برآورده سازد، اين فرض ميتواند اغلب خطرناك باشد. درك و مديريت نيازمنديها يا الزامات مربوط به دادهها نه تنها نكتهاي كليدي براي نگهداري دادههاي اصلي باكيفيت است، بلكه همانگونه كه انتظار میرود، كليد مديريت موفقيتآميز پروژه پاکسازی دادهها است.
لذا در پاسخ به سؤال چرا به پاکسازی دادهها نياز داریم میتوان گفت، پاکسازی دادههای اصلی جهت اطمينان از اينكه دادههای اصلی نیازها را برآورده ميكنند، ضروري است؛ به عبارت ديگر پاکسازی دادهها جهت اطمينان از اينكه فهرست (ركوردهاي) دادههای اصلی بهروز هستند، لازم است و شامل همه دادههاي مورد نياز جهت پشتيباني همه مأموریتها و وظايف صورت گرفته در انجام يك كار است. به طور خلاصه پاکسازی دادهها فرايندي است كه دادههای اصلی باكيفيت را ايجاد و حفظ ميكند.
8- مزاياي پاکسازی و بهبود کيفيت دادهها در سازمان
كيفيت دادهها، رمز موفقيت پايگاه اطلاعاتي و يگانه عاملي است كه سبب اعتماد و اتكاي كاربران مختلف به آن خواهد شد و بر سرعت انجام تراكنشها و فعالیتهای مربوطه مؤثر خواهد بود. اين موضوع عليالخصوص در پايگاههايي كه دادههاي اصلي و پايه را براي استفاده در سیستمهای عملياتي متعدد مديريت میکنند، اهميت بسيار زيادي دارد. ملموسترين فايده پاکسازی دادههای اصلي، شناسایی اقلام تکراری يا دوگانگيهاي بالقوه است. منافع مالی ناشی از رفع و برطرف نمودن موارد تکراری (دوگانگيها) به راحتي در فعاليتهاي مختلف مانند طراحی سیستم، مهندسی، ساخت، عملیات و نگهداری قابل اندازهگیری است.
از نقطهنظر مالی کیفیت دادههای اصلی، کلیدی تعيينكننده در درستي تحلیلهاي مالی است. برنامههاي کاربردی مربوط به برنامهریزی منابع سازمانی (ERP) نمایی منسجم از سازمان را به خوبي فراهم ميكنند، اما صحت و درستي این نما به کیفیت دادههای اصلی بستگي دارد. مشهور است که نقطه ضعف (پاشنه آشیل) هر ERP کیفیت دادههای اصلی است؛ این موضوع تا حد زیادی به عجله در بارگذاری دادهها در زمان مورد نظر، عدم تعهد و التزام به کار، کمبود بودجه یا تخصص براي برگشت به عقب و تمیز کردن دادهها مربوط میشود.
از ديگر مزاياي پاکسازی و بهبود كيفيت دادهها میتوان به حذف چند زباني دادهها، ارتقاء کیفیت دادهها از نظر معنایی و دستوری يا نحوي و از بين بردن مشكل پاك و خالص نبودن اطلاعات نام برد.
9- راه حل كلي بهبود کیفیت و پاکسازی دادهها
برای بهبود کیفیت دادههایی که در بین سازمانها و بنگاههای مختلف مبادله میشوند، مراحل اساسی زیر پيشنهاد ميشود.
1- تدوین استانداردی هماهنگ و یکپارچه برای دادههای اساسی یا انبارهای داده سازمانها و مؤسسات برای تسهیل تبادل اطلاعات
مکانیسم ایجاد چنین استانداری به این صورت خواهد بود که یک سازمان متولی یا سازمان نگهدارنده دادهها (DMO)، استانداردهایی را – با نظر و پیشنهاد سازمانهای مطبوع و ذینفع- برای انواع مختلف اقلام داده ایجاد، پشتیبانی و هدایت میکند و آن را به صورت آزادانه در اختیار سازمانهای مختلف و شرکای تجاری قرار میدهد تا همگی بر اساس آن الگوی استاندارد، انبارهای داده خود را طراحی نمایند. به چنین مکانیسمی در ادبیات تجارت الکترونیکی دیکشنری فنی باز (OTD) میگویند، یعنی یک مرجع جامع برای تعیین استانداردهای تبادل داده. این سازمان همچنین باید سازوکاری برای بهنگامسازی، نظارت و کنترل و به جریان انداختن کل فرایندهای جاری در سطح کشور ایجاد کند.
2- محقق شدن مرحله 1 به تنهایی کافی نیست، بلکه باید دادههایی که بین سازمانهای مختلف مبادله میشوند علاوه بر هماهنگ و استاندارد شدن دارای کیفیت مناسبی باشند تا بتوانند تصویری شفاف از موجودیتها ارائه دهند. لذا باید قواعد چهارگانه ذیل در مورد دادههای اساسی به دقت مورد توجه قرار گیرد:
قواعد معنایی
مجموعه اصول استاندارد برای نامگذاری هستند. قواعد معنایی سبب انتخاب نام متناسب با بار معنایی آن میشوند؛ یعنی نام انتخاب شده باید حاوی معنی متناسب با آن در فرهنگ و زبان کاربران آن باشد. توجه اصلی قواعد معنایی به معانی نامها و قسمتهای مختلف نامها معطوف است.
قواعد نحوی و دستوری
قواعد نحوی ترتیب قرارگیری قسمتهای نام را برای سازگاری مفهومشان با آن قلم را مشخص میکند. این ترتیب میتواند نسبی، قطعی یا ترکیبی از این دو باشد.
قواعد واژهای
قواعد واژهای به ظاهر نامها اهمیت میدهند و سبب کاهش تکرارها و افزایش دقت در نامگذاری میشود. رعایت اختصار، واژگان هم معنی، طول نامها و املا نکاتی هستند که در قواعد واژهای به آنها پرداخته میشود.
قواعد یکتایی
قواعد یکتایی نیز سبب اختصاص نامهایی منحصربهفرد به اقلام میشود.
3- در صورت ایجاد یک دیکشنری فنی باز (OTD) میبایست مفاهیم مهم مرتبط باکیفیت دادهها ازجمله: منشأ دادهها، صحت و درستی آنها، تمامیت دادهها، تحلیل و پروفایل کردن دادهها، پایش و نظارت بر مراحل مختلف فرایند چرخه دادهها، تمیز کردن و پالایش دادهها، پایداری و انعطافپذیری دادهها و به روز بودن دادهها به دقت مورد توجه قرار گیرد. فرایند بهبود کیفیت دادهها را میتوان در چرخه زیر خلاصه کرد.
شكل2- فرایند بهبود کیفیت دادهها
نکته: منظور از سازمان در این نمودار، تمامی بنگاههای تولیدی- خدماتی، سازمان و مؤسسات دولتی و خصوصی، وزارتخانهها و زیرمجموعههای آنها و غیره است.
10- نتیجهگیری
در همه سازمانها و مؤسسات، دادهها و اطلاعات در كنار ساير عوامل توليد، نقش تعیینکنندهای دارند. اين دادهها، اغلب در سیستمهای اطلاعاتي يك موسسه يا بين چندين موسسه مبادله شده و گردش دارند همانگونه که دادههای درست و باکيفيت در سیستمهای اطلاعاتي تأثیر مثبت و سازندهاي دارند، دادههای بيکيفيت، آلوده و غلط يا ناهماهنگ به همان اندازه تأثیر منفي و تخریبکنندهای در عمليات هر يك از سازمانها به جاي ميگذارند. در اين مقاله مدلي براي بهبود كيفيت دادهها در كشور ارائه شده است كه در صورت اجرای آن، یک دیکشنری فنی باز (OTD) از دادههای باکیفیت (از نظر معنایی و دستوری و غیره) قابل تبادل سازمانها با همکاری خود این سازمانها (از طریق ارائه الگوهای مورد نظر خود) در سطح کشور ایجاد خواهد شد که تمامی سازمانها و مؤسسات میتوانند با مراجعه به سازمان متولی این پایگاه استاندارد داده، دادههای خود را مطابق با این استاندارد با شرکای تجاری و غیرتجاری خود هماهنگ کنند. در چنین سازوکاری یک زبان مشترک از دادههای قابل تبادل سازمانها که دادههای موجود در آن نیز از کیفیت بالایی برخوردار است، ایجاد میشود که مزایای زیر را برای سازمانها به همراه دارد:
- شفافیت دادههای مبادله شده درونسازمانی و برونسازمانی
- کاهش دوبارهکاریها و هزینههای تصفیه و بازخوانی دادهها
- ایجاد سرعت و دقت در تبادل دادهها
استفاده از Gs1 در سیستم پیشنهادی اطلاعاتی و کمک فناوری اطلاعات |
1- مقدمه
سيستم کدينگ GS1 میتواند راهکاري خوبي براي کدينگ اطلاعات در سیستمهای اطلاعاتي باشد. چراکه با وجود اين مکانيزم امکان ذخیرهسازی و رديابي داده به سهولت قابل استفاده است. در سیستمهای اطلاعاتي فيلدهاي يکتايي به کار میرود که براي يونيک کردن داده بسيار حائز اهميت است؛ اما نکته اينجاست که هیچیک بار اطلاعاتي را به کاربر و مشتري نشان نمیدهد. چنانچه کدي با اين مشخصه هم ساخته شود باز نمیتوان به طولانیمدت و با اطمينان از آن استفاده کرد زيرا تجربه کدينگ در آن ها لحاظ نشده و حتماً در ادامه کار مشکلاتي را براي طراح سيستم به همراه خواهد داشت. اينجاست که سيستم کدينگ میتواند راهکاری را در سیستمها ارائه داده و در بسياري از سیستمها مورد استفاده قرار گيرد. از طرفي میتواند بهصورت بارکد توسط سیستمهای متصل به آنها (مانند PDA) خوانده شده و کار جستجوي داده بر اساس تايپ را هم آسان کند. لذا در اين مقاله سعي شده است سیستمهایی که میتواند کدينگ GS1 در آنها استفاده گردد، پيشنهاد شود.
2- انواع سیستمهای اطلاعاتي بر اساس تصميم
- نظام اداري خودکار
- سیستمهای پردازش عمليات
- سيستم اطلاعات مديريت
- سيستم پشتيباني تصميمگيري
- سیستمهای پشتيباني تصميمات گروهي
- سیستمهای پشتيباني مديران ارشد
- سیستمهای هوش مصنوعي و سیستمهای خبره
- سیستمهای مديريت دانش
- سیستمهای مديريت اسناد
- سیستمهای کتابخانه
- سیستمهای مديريت مشتری
نکته: رديابي محصولات يا خدمات در سراسر سیستمهای توزيع براي شناسايي و اصلاح خطاها و کاهش زمان تأخير در تحويل کالا و خدمات به مشتريان بسيار مهم و ضروري است.
سیستمهای اطلاعات توزيع با بهکارگیری فناوريهاي نوين اطلاعاتي در برآوردن سرعت تحويل محصولات به مشتريان نقش مهمي را ايفا میکنند.
سيستم ارزش شامل عرضهکنندگان است که وروديهاي لازم براي سازمان و زنجيره ارزش آن ارائه ميکنند. بعد سازمان کالا يا خدمات را توليد ميکند و اين کالا و خدمات از زنجيره ارزش توزیعکنندگان و همه راههای منتهي به خريداران عبور ميکنند.
تمام بخشهاي زنجيره ارزش در سيستم ارزش جاي ميگيرد. کسب و حفظ مزيت رقابتي و پشتيباني اين مزيت بهوسيله ابزارهاي فناوري اطلاعات نيازمند به درک کل سيستم ارزش است.
3- بررسي چگونگي ايجاد يک کسبوکار جديد
قابليتهاي رايانه يا پايگاههاي داده ميتوانند فرصتهايي براي ايجاد کسبوکار جديد ايجاد کند.
سازمانها بايد به اين سؤالات پاسخ بدهند:
- چه نوعي از اطلاعات ايجاد شده به وسيله سازمان بايد فروخته شود؟
- کدامیک از قابليتهاي فناوري اطلاعات براي شروع يک کسبوکار جديد مناسب است؟
- آیا فناوري اطلاعات میتواند اقلام جديد را در ارتباط با محصولات فعلي سازمان توليد کند؟
4- مراحل چرخه زندگی مشتری
- مشتريان بالقوه: افرادي که هنوز مشتري نيستند ولي ميتوانند به مشتري تبديل شوند.
- مشترياني که عکسالعمل نشان ميدهند: مشتريان بالقوه يا احتمالي که به يک محصول يا خدمت علاقه و واکنش نشان ميدهند.
- مشتريان بالفعل: افرادي که در حال حاضر محصول يا خدمتي را به کار ميبرند.
- مشتريان سابق: اينگونه افراد مشتريان مناسبي نيستند چراکه مدت زيادي است در هدف فروش قرار ندارند و يا خريدشان را به سمت محصولات رقيب برده اند.
فرضيات اين چارچوب اين است که مشتريان 12 گام اساسي را در ارتباط با عرضهکنندگان برميدارند و در هر مرحله بايد مشخص شود که آیا فناوري اطلاعات میتواند جهت دستيابي به مزيت رقابتي مورد استفاده قرار بگيرد و يا خير. اين گامها عبارتاند از:
1- ايجاد نياز در مشتري
2- مشخص شدن نيازهاي مشتري
3- انتخاب منبع: ارتباط مشتري با عرضهکننده.
4- سفارش دادن
5- پرداخت قيمت کالا و خدمات
6- به دست آوردن کالا و خدمات
7- آزمون يا پذيرفتن کالا و خدمات
8- ترکيب کالاها يا مديريت موجودي
9- نظارت بر استفاده
10- بالا بردن مصرف در صورت نياز
11- انتقال يا مرتب کردن کالا و خدمات
12- نگهداري صورتحسابهای مالي خريدها (حسابداري)
در اقتصاد سنتي، داراييهاي ملموس، مانند زمين، نيروي کار، سرمايه و منابع طبيعي به عنوان مهمترين عوامل توليد در نظر گرفته ميشدند. در حالي که در اقتصاد جديد، ارزش واقعي سازمانها به دانش، ايدهها و نگرشهاي نهفته در مغز کارکنان آنها بستگي دارد و در اين اقتصاد دانش سازماني بهعنوان يک دارايي راهبردي در نظر گرفته میشود.
5- فرآیند مديريت دانش
خلق، کسب، سازماندهي، انتقال و به اشتراک گذاشتن دانش از عناصر اصلي تشکیلدهنده مديريت دانش است که بهعنوان فرآیند مديريت دانش شناخته میشود.
نکته: مديريت دانش فرآیندي خطي و ايستا نيست بلکه فرآیندي پويا و چرخهاي است.
5-1 . خلق دانش
ايجاد دانش با فعالیتهای داخلي يک سازمان مرتبط است. خلق دانش شامل ايجاد ايده جديد، شناخت الگوهاي جديد، ترکيب قواعد جدا از هم و ايجاد فرآیندهاي جديد است.
دانش از طريق فعاليتهايي مانند خريد، حل مسائل بهصورت گروهي، انطباق با تغييرات محيطي، فعاليت شبکههاي غيررسمي و غیره ايجاد میشود.
مثال: دانش جديد ممکن است از طريق خريد يک شرکت يا استخدام افراد بهعنوان کارمند يا مشاور (يعني کساني که داراي دانش مورد نظر هستند) به دست ميآيد.
نکته: سازمانها در پاسخ به تهديدات محيطي، ورود محصولات يا رقباي جديد، تغيير شرايط اقتصادي و اجتماعي مجبور به ايجاد دانش جديد بشوند.
نيروهاي تهدیدکننده محيطي اهرم فشاري براي توليد دانش هستند.
5-2 . کسب دانش
کسب دانش با جستجوي داده، اطلاعات و دانش و اعتباربخشي آنها از طريق منابع مختلف شروع میشود.
از دانشي که قبلاً کسب شده است براي طبقهبندي و برنامهريزي بهتر منابع کسب دانش بهويژه منابع خارجي استفاده میشود.
روابط با مشتريان، حمایتکنندگان، رقبا و شرکا باعث کسب دانش میشود. همچنين، همکاری و مشارکت با بخشهاي ديگر صنعت يکي ديگر از راههای به دست آوردن دانش است تا بدين گونه، بتوانيم از قوه ابتکارات ديگر سازمانها استفاده کنیم.
5-3 . کدبندی دانش
کدبندی دانش عبارت است از فرآیند قرار دادن دانش در قالبها و اشکال مختلفي که قابل دسترسي و انتقال باشد.
بررسي و شاخهبندي دانش کاري است مشکل، به همان اندازه که جمعآوري و تغيير آن سخت است.
کدبندي دانش میتواند از يک کدبندي رسمي و آشکار (مانند سياستها و رويهها) تا آرشيوي از عناصر نهان (مانند داستانها) درجهبندي شود. ابزارهايي چون نقشههاي دانش به يافتن محل نگهداري آن در بين سازمانها و درون آنها کمک ميکند.
تعريف نقشههاي دانش: شامل تسخير وروديها و خروجيهاي کليدي دانش است. وروديهاي کليدي ممکن است شامل دادهها و اطلاعات خاص، ارتباطات گفتاري يا نوشتاري و ديگر دانشهاي عيان و نهان به اشتراک گذاشته شده مثل تجربيات مفيد باشند.
خروجيهاي کليدي ممکن است مدارک داخلي، گزارشها، مقالات پژوهشي، روندها، محکهاي داخلي و تجربيات مفيد باشند.
اصول اساسي براي کدبندي دانش شامل موارد زیر است:
- تعيين اهداف راهبردي سازمان (آنچه دانش براي رسيدن به آن کسب میشود)
- شناسايي دانش هاي موجود که براي رسيدن به اهداف راهبردي سازمان ضروري هستند.
- ارزيابي دانش موجود بهمنظور تعيين مفيد و سودمند بودن آنها.
- تعيين ابزاري براي تدوين و توزيع دانش
5-4 . ذخيره دانش
دانش خامي که در اختيار قرار ميگيرد (داده و اطلاعات) بايد در مکاني ذخيره شود که بتوان آن را مديريت نمود، حفاظت کرد و در دسترس ديگران گذاشت.
بيشتر سازمانها سیستمهای مختلف اطلاعاتي از قبيل کنترل موجودي، سیستمهای بودجهبندي، سیستمهای اداري براي ذخيره دادهها يا حقايق سخت دارند؛ اما چنين سیستمهایی را براي اطلاعات و دانش نرم دارند.
نکته:
-دادههاي ايجاد شده توسط کارکنان در زمينه کاري بهندرت به بيش از يک گروه کوچک همکاران انتقال پيدا ميکند.
-کارکنان معتقدند که يادگيري سازماني بيشتر زماني اتفاق ميافتد که تجربيات و وقايع به صورت الکترونيکي و براي مراجعات آينده ذخيره شوند.
5-5 . انتقال دانش
انتقال يا توزيع، فرآیندي است که طي آن يک سازمان دانش و اطلاعات خود را ميان اعضاء تقسيم ميکند و از اين طريق يادگيري را ارتقاء داده و دانش يا درک جديدي را به وجود ميآورند.
نکات:
- انتقال دانش در داخل سازمان پیششرط حياتي براي ايجاد اطلاعات و تجاربي است که سازمان میتواند از آن استفاده کند.
- براي اينکه انتقال دانش توسط يک سازمان ارزشمند باشد به تغييراتي در رفتار، روشها، سياستها و همچنين به توليد ايدهها، فرآیندها، روشها و سياستهاي جديد منجر شود.
- استفاده از زبان واضح و روشن براي انتقال دانش، قرار دادن پاداشهايي براي به اشتراکگذاری دانش، حمايت فرهنگ سازماني از اشتراک و انتقال دانش میتواند مؤثر باشد.
- فرآیند انتقال دانش برخي مواقع نامحسوس است و نبايد فقط به هنگام ترک کارکنان به دلایل مختلف از سازمان به فکر انتقال افتاد.
راهبردهاي عمده جهت انتقال دانش شامل موارد زیر است:
1- راهبرد انتقال فرد به جمع
2- راهبرد فردبهفرد
5-6 . کاربرد دانش
از ديدگاه اکثر پژوهشگران مديريت دانش، اين مرحله مهمترين مرحله فرآیند است.
به اعتقاد آنها مزيت رقابتي نصيب سازمانهايي که بهترين دارايي دانشي را دارند نميشود؛ بلکه متعلق به سازمانهايي است که به بهترين صورت از دانش خود در عمل استفاده ميکنند.
6- سیستمهای مديريت دانش (کي.ام.اس)
سیستمهای مديريت دانش شامل بهکارگيري فناوري اطلاعات جهت کمک به ايجاد، جمعآوري، مرتب کردن، ذخیرهسازی و به اشتراک گذاشتن دانش و اطلاعات در داخل يک سازمان است.
سیستمهای مديريت دانش شامل فرآیند ايجاد، سازماندهي توزيع دانش (يعني شکلي از مدارک مخازن، پايگاه دادهها، رويهها) در داخل سازمانهاي پيچيده مانند شرکتهاي بزرگ، دانشگاهها و سازمانهاي دولتي است.
سيستم مديريت دانش يک سيستم فني اجتماعي است که هدفش مديريت و به اشتراک گذاشتن دانش جهت پشتيباني از دستيابي به اهداف سازمان است.
7- تعريف تجارت الکترونيکي
مبادله محصول (کالا يا خدمات) بين خريداران و فروشنده، از طريق اينترنت يا شبکههاي ارتباطي ديگر، به فعالیتهای متعددي نظير خريد، فروش و بازاريابي محصولات و خدمات از طريق شبکه اينترنت، تجارت الکترونيکي گفته میشود.
نکته:
- فرآیند تجارت الکترونيکي مبين تعامل بين چهار جزء خريدار، فروشنده، طرف سوم و فناوري است.
- خريدار، فروشنده و طرفهاي سوم از طريق يک بازار الکترونيک که بهوسیله فناوري اطلاعات حمايت میشود، به يکديگر متصل ميشوند.
- طرفهاي سوم شامل سازمانهاي بیطرف مانند بانکها و سازمانهای ارائهدهنده کارتهاي اعتباري است.
8- متداولترين فناوريهاي مورد استفاده در تجارت الکترونيک:
- کد ميلهای (بارکد)
- پست الکترونيک
- بانکداری الکترونيک
9- سیستمهای تسهیلکننده تجارت دولت الکترونيک:
1- سيستم برنامهريزي يکپارچه منابع سازمان (ERP)
2- سيستم مديريت ارتباط با مشتري (CRM)
نکته:
- به طور کلي کسب اطلاعات از طريق منابع غير رسمي و به روشهاي الکترونيکي کاراتر و کمهزينهتر از ديگر شيوههاي رسمي است.
- هزينه روشهاي الکترونيکي براي کسب داده، تقريباٌ 70 درصد کمتر از طراحي، خريد، استفاده و انتقال دادهها به روش کاغذي آن است.
10- نتیجهگیری
یکی از اهداف سیستم کدینگ، ارائه راهکار برای ذخیرهسازی، ردیابی و پردازش داده است. این امکان در برنامه سیستمهای اطلاعاتی بسیار کاربرد دارد و مورد استفاده است. لذا هدف از این مقاله معرفی برخی از این سیستمها در جهت استفاده از این مکانیزم است.