در گفت وگو با ایسنا اعلام شد

اضافه شدن بخش های ترجمه و نقشه به جویشگر پارسی جو، تدوین نقشه راه اینترنت اشیا

اضافه شدن بخش های ترجمه و نقشه به جویشگر پارسی جو، تدوین نقشه راه اینترنت اشیا لینك بخر دات كام: معاون پژوهشكده IT پژوهشگاه ارتباطات و فناوری اطلاعات از اضافه شدن قابلیت های موتور جستجوی ˮپارسی جوˮ آگاهی داد و اظهار داشت: این قابلیت ها با همكاری شركت های فناور و استارتاپ ها بوده است.



مریم طایفه محمودی در گفت وگو با ایسنا راه اندازی جویشگرهای بومی را یكی از موضوعات محوری این پژوهشكده دانست و اضافه كرد: "پارسی جو" و "یوز" دو تا از جویشگرهای بومی هستند كه تحت حمایت پژوهشگاه و با همكاری دو دانشگاه، راه اندازی و با همكاری بعضی از شركت ها به قابلیت های این موتورهای جستجوگر اضافه شده است.

وی اضافه شدن بخش ترجمه به این موتورها را همچون قابلیت های جدید این موتور دانست و اشاره كرد: به منظور تصحیح فرآیند جستجو، بعضی از شركت های فناوری كه در حوزه نقشه فعال بودند، با پارسی جو در این زمینه همكاری كردند.

محمودی با اشاره به اینكه جویشگر پارسی جو یك موتور جستجوی فارسی زبان است، اظهار نمود: به منظور توسعه كاربردهای این موتور جستجو قابلیت ترجمه باز به آن افزوده شد. این قابلیت باعث شده است تا كاربران به اطلاعات دیگری دسترسی داشته باشند.

معاون پژوهشكده IT پژوهشگاه ارتباطات و فناوری اطلاعات با اشاره به اهمیت راه اندازی موتور جستجوی فارسی، توضیح داد: هم اكنون جویشگرهای زیادی مانند گوگل با قابلیت های زیاد وجود دارند و كمتر كاربران به سمت جویشگرهای فارسی زبان می روند، ولی از آنجایی كه خیلی از محتواها و مستنداتی كه در سطح دانشگاه ها و سازمان ها و یا در سطح كشور وجود دارد كه به دلایل فرهنگی و اجتماعی و امنیتی امكان جستجو و بازیابی اطلاعات آنها از راه جویشگرهای موجود فراهم نیست، از این رو پیاده سازی جویشگرهای بومی ضروری بود.

طایفه محمودی، "كلان داده ها" (Big Data) را از دیگر پروژه های این پژوهشكده نام برد و تصریح كرد: از آنجایی كه روز به روز به شكل گسترده داده ها افزایش می یابند لازم است این داده ها مورد تحلیل و ارزیابی قرار گیرد تا داده های مورد نیاز استخراج شود و در اختیار كاربران قرار گیرد كه در این راستا طرح "كلان داده ها" می تواند موثر باشد.

وی با اشاره به اینكه داده های موجود در این بخش شامل داده های متنی، صوتی، تصویری و ویدئویی است، افزود: این داده ها قابل استفاده برای همه سازمان ها و مراكز است؛ چونكه خیلی از این نهادها دارای داده های وسیعی هستند و تحلیل این داده ها می تواند قابل كاربرد برای این نهادها باشد.

محمودی در عین حال با تاكید بر اینكه ذخیره سازی این داده های كلان در یك مركز امروزه منتفی شده است، افزود: از آنجایی كه داده های هر دستگاه و نهادی بسیار زیاد است و از طرف دیگر تلاش میگردد تا این داده های وسیع به بسترهای "ابری" و "مه" بارگذاری شود تا امكان دسترسی از هر مكانی و در هر زمانی فراهم باشد، از این رو راه اندازی كلان داده در هر سازمانی به صورت جداگانه صورت می گیرد.

این محقق حوزه فناوری اطلاعات، "اینترنت اشیا" (IOT) را از دیگر موضوعات مطالعاتی این پژوهشكده نام برد و اظهار داشت: با عنایت به توسعه كاربردهای این فناوری در كشور، با تعامل با شركت ها و استارتاپ ها نسبت به تدوین نقشه راه اینترنت اشیا اقدام كردیم. ضمن آنكه آزمایشگاه های آن باز در حال راه اندازی است.

وی بیشترین كاربرد این فناوری را در مصرف انرژی دانست.

به گزارش لینك بخر دات كام به نقل از ایسنا، نسخه سازمانی موتور جستجوگر پارسی جو، قادر می باشد میلیاردها سند با قالب های مختلف را خزش (Crawl) و سپس ذخیره سازی و نمایه سازی (Indexing) بر بستر توزیع شده در كمتر از یك ثانیه در آنها عملیات جستجو به زبان فارسی را انجام دهد.

سرویس جستجوی پارسی جو متناسب با نیاز سازمان ها و به صورت سفارشی باز به نمایش خدمات می پردازد. با عنایت به وجود اطلاعات متنوع در یك سازمان، سرویس مذكور باز راهكارهای یكپارچه برای پاسخگویی به نیازهای موجود نمایش می دهد.

پوشش بیشتر از ۱۰ میلیارد سند وب (متن، تصویر، ویدئو و صوت)، مدیریت گراف وب با بیشتر از ۴۰۰ میلیارد یال، جستجوی همزمان روی داده با قالب های مختلف ورودی، ذخیره سازی ده ها میلیارد سند روی بستر Hadoop/HBase، پردازش و استخراج هوشمند اطلاعات و دانش از اسناد فارسی، جستجوی سریع در كم تر از یك ثانیه در مقیاس بزرگ و حجم زیاد داده (میلیاردها سند)، اتصال به واحد پردازشگر زبان (درك و گسترش پرس وجو، خطایابی) و جستجوی پیشرفته با فیلترهای مختلف زمان، نوع داده و مكان از قابلیت های این موتور جستجو است.
پارسی جو همین طور قابلیت بازیابی نتایج برمبنای پردازش های پیشرفته و هوشمند، دسته بندی اسناد با استفاده از روش های مدرن، تركیب جستجو روی اسناد داخلی و وب، نمایش نتایج متناسب با نیاز كاربران و نمایش API سفارشی را دارد.
اخبار، آب وهوا، اوقات شرعی، تصاویر، آوا، ترجمه و نقشه همچون خدمات این جویشگر فارسی است.
سامانه پردازش كلان داده (سامپاد) باز خدمات ذخیره سازی، مدل سازی و پردازش اطلاعات روی داده های حجیم را نمایش می دهد. این سامانه با فرمت های مختلف ورودی سازگار است، جستجو و پردازش اطلاعات را انجام می دهد، الگوها و آنومالی ها را كشف و دانش مورد نیاز را استخراج می كند.
این سامانه قابلیت سازگاری با ورودی های ساختار یافته/نیافته، ذخیره سازی ده ها میلیارد داده با حجم چندین پتا بایت روی بستر Hadoop/Hbase، پردازش داده ها برای كشف آنومالی، خوشه بندی و دسته بندی روی بستر Spark، نمایه سازی سریع داده ها برای دسترسی سریع با استفاده از روش های نمایه سازی معكوس و پردازش های مربوط به گراف را دارد.
جستجوی همزمان روی داده ها با الگوهای مختلف ورودی، زبان پرس وجوی ساختار یافته، نمایش نتایج به شكل مناسب و خوانا با نمایش پویا و جستجوی تركیبی با فیلترهای گوناگون (زمان، قالب و مكان) از دیگر قابلیت های این سامانه به حساب می آید.



1397/10/20
15:58:54
5.0 / 5
17
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
نظر شما در مورد این مطلب
نام:
ایمیل:
نظر:
سوال:
= ۲ بعلاوه ۱
دوستان ما