همانطور که می دانید، اینترنت دنیای وسیعی از اطلاعات است و هدف از راه اندازی این سیستم تسهیل و تسریع در دسترسی به این اطلاعات، در محیطی مطمئن و مطابق با قوانین کشورمان ایران و عقاید و اعتقادات هموطنانمان است. رپیدباز علاوه بر اینکه فایلهای درخواستی را ظرف ثانیه ها در اختیار کاربران خود بدون نیاز به نگاه کردن و کلیک کردن بر روی تبلیغات سایتهای خارجی که اکثرا مستهجن و غیراخلاقی هستند قرار می دهد، امکان مرور و جستجو در بانک وسیعی از فایلهای درخواستی سایر کاربران و قابلیت دانلود رایگان آنها را نیز می دهد. از این سو و در جهت رسیدن به این اهداف، تمهیداتی از جمله کشف کاستی های فیلتر مخابرات و اجرای سیستمی پویا جهت تصفیه فایلهای مردود که خواسته یا ناخواسته بر روی سیستم قرار داده می شود نیازی مبرم شناخته شده است. در همین راستا و در جهت فراهم آوردن بستری پایدار و سالم جهت برقراری ارتباط کاربران ایرانی تمام اقدامات در توان خود را در هفته های اخیر در این راه استفاده نموده ایم.rapidbaz filter system

 سیستم تشخیص محتویات رپیدباز که بصورت خیلی ساده و فقط با نگاه کردن به اسم فایلها و استفاده از لیست محدودی از واژه های ممنوعه پس از دانلود اجرا و فعال می شد کلا کنار گذاشته شد و سیستم جدیدی جایگزین آن شد. تحقیقات زیادی انجام شد و در همین مسیر به مقالات و تکنیک های مختلفی رسیدیم که جهت اطلاع کاربران گرامی خلاصه ای از روشهای استفاده شده در تشخیص فیلتر را با اولویت در نقش آنها در سیستم در اینجا مرور می شود.

 سیستم تشخیص زنجیره ای داده ها:
در بررسی های انجام شده به یک مقاله از یکی از دانشجویان دکتری دانشگاه واترلو کانادا رسیدیم که از الگوریتم خود در حیطه استخراج عبارات و ایندکس کردن آنها به تفصیل یاد کرده بود. شاید خیلی وقتها و در خیلی از سیستمهای فیلترینگ که در دنیا بکار گرفته شده است، از جمله سیستمهای مورد استفاده درسیستم مخابراتی اینترنت، واژه ها تنها ملاک فیلتر شدن و نشدن یک فایل یا یک صفحه باشند یعنی اگر در آدرس آنها این اسم به هر نوعی و در هر کاربردی استفاده شود آن صفحه و آدرس فیلتر می شود. این سیستم کاملا استاتیک می باشد ولی با روش یاد برده شده ما به کاربرد واژه ها نگاه می کنیم.
این کار با کنکاش در اطلاعات از پیش بدست آمده انجام می گیرد (Data Mining) یعنی برنامه با گرفتن چند نوع گزارش بصورت پوششی از بانک اطلاعاتی اقدام به پیدا کردن عبارات در فایلهایی می کند که پیش از این فیلتر شده اند و با پیدا کردن وجه تشابه آنها و ترتیب قرار گیری شان به عباراتی می رسد که در این نوع فایلها مورد استفاده قرار گرفته اند.این سامانه کاملا پویا بوده و با مرور زمان و خودآموزی آن، بانک عبارات آن وسیع تر شده و موثرتر می شود.

rapidbaz_filter_system_splution table

 اگر جملات سمت چپ را جملات فیلتر شده در نظر بگیریم و روش قرار گیری آنها را بصورت نمایی در سمت راست داشته باشیم به عبارات سفرهای ماهیگیری (Fishing trips) و سفرهای قایقرانی (rafting trips) خواهیم رسید. حال با قرار دادن این عبارات به عنوان عبارات منفی در بانک اطلاعات می توانیم فایلهای مشابه فایلهای فیلتر شده را در بانک اطلاعاتی موجود پیدا کنیم. با قرار دادن عبارات در بانک اطلاعاتی سیستم فایلهای جدید که با این عبارات تطبیق داده می شوند نیز فیلتر می شوند. در حقیقت این الگوریتم می تواند جلوی اشتباهات احتمالی در رد عباراتی که واژه ها با قرار گرفتن کلمات در مکان های مختلف معانی مختلف پیدا می کنند را می گیرد و تعریفی دقیق تر از موارد ممنوعه می کند. مثلا در مثال بالا اگر بخواهیم واژه سفرها (trips) را بتنهایی مردود بشناسیم، خیلی از عبارات که در مورد سفر ها توضیح می دهند یا سایر سفر ها را نیز از دسترس کاربران خارج می کنیم.

رتبه بندی واژه ها و عبارات:
عبارات و واژه های قرار داده شده در بانک اطلاعاتی و در جدول مربوط به سیستم تشخیص محتویات غیر اخلاقی، ارزشی متفاوت دارند و با توجه به تکرار آنها و تشخیص مدیران تعیین و ثبت می شوند. زمانیکه فایل جدیدی وارد این سیستم جهت آزمون می شود، با تمام عبارات و واژه های ثبت شده در بانک تطبیق داده می شود و درصد احتمال مردود بودن آنها مشخص می شود و بر آن اساس سیستم تصمیم بر دانلود و یا مردود دانستن فایل می کند. واژه ها و عبارات ثبت شده در بانک اطلاعاتی می توانند ارزش منفی یا مثبت داشته باشند یعنی همانطور که درصد احتمال بالا می رود می توانند در مواردی که گزارش داده می شوند و مدیریت تشخیص داده می شود می تواند پایین ببرد.

گزارش خطاها توسط کاربران:
جهت رفاه کاربران گرامی و پویا نمایی سیستم تشخیص هویت فایلهای درخواستی، سیستمی جهت معرفی مشکلات موجود در سیستم طراحی و به اجرا گذاشته شده است. کاربران می توانند علاوه بر این که ضعف های سامانه را به اطلاع مدیران برسانند، اطلاعات و عبارات و واژه های پیشنهادی خود را نیز جهت اضافه شدن به بانک اطلاعاتی سامانه ارسال نمایند.rapidbaz filter system user report
با توجه به شرایط جدید و توسعه فعالیت ها، تمام تلاش ما است که در کمتر از یک ساعت در ساعات اداری بتوانیم پاسخگو به گزارشات کاربران باشیم.

 چک کردن دستی فایلها:
با توجه به اینکه هیچ سیستم خودکاری نمی تواند ۱۰۰% تضمین شناسایی موارد و فایلهای مورد دارد را دهد، فایلهای ارسالی بطور دستی در حد امکان با اولویت بر فایلهایی که بیشترین احتمال مردود بودن را دارند (سیستم شناخته است) و یا فایلهایی که نامفهوم هستند و مشکوک چک شده و دستی فیلتر می شوند.
مشترکین سیستم می توانند فایلهایی که سیستم اشتباها مردود شناخته است را با قبول کردن مسولیت آن دانلود کنند. در صورتیکه افرادی بخواهند از این قابلیت سو، استفاده کنند، با چک کردن دستی این افراد شناخته شده و اشتراک آنها در صورت تکرار مسدود می شود.