<?xml version='1.0' encoding='UTF-8'?><?xml-stylesheet href="http://www.blogger.com/styles/atom.css" type="text/css"?><feed xmlns='http://www.w3.org/2005/Atom' xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/' xmlns:blogger='http://schemas.google.com/blogger/2008' xmlns:georss='http://www.georss.org/georss' xmlns:gd="http://schemas.google.com/g/2005" xmlns:thr='http://purl.org/syndication/thread/1.0'><id>tag:blogger.com,1999:blog-6112737</id><updated>2024-11-01T11:43:54.923+01:00</updated><category term="ترجمه ماشینی"/><category term="زبان فارسی"/><category term="سرویس رایگان"/><category term="ابزار ترجمه"/><category term="بورس تحصیلی"/><category term="مترجم فارسی"/><category term="گوگل"/><category term="ترجمه مجانی"/><category term="مترجم گوگل"/><category term="پیکره"/><category term="بورس دکترا"/><category term="نیم‌فاصله"/><category term="پردازش زبان طبیعی"/><category term="اروپا"/><category term="ایران"/><category term="ترجمه"/><category term="داده کاوی"/><category term="دکترا"/><category term="شغل"/><category term="ماشین ترجمه"/><category term="هلند"/><category term="کنفرانس"/><category term="API"/><category term="آمستردام"/><category term="آموزش ، اسلاید"/><category term="آموزش، منابع، اسلاید"/><category term="اولویت با خانمها"/><category term="اینترنشیپ"/><category term="برنامه"/><category term="بورس تحصیلی، مهندسی نرم افزار"/><category term="ترجمه ماشینی، بورس تحصیلی"/><category term="ترجمه کاربردی"/><category term="تعریف پایه"/><category term="تکنولوژی جدید"/><category term="حافظه‌ترجمه"/><category term="خبر"/><category term="دادگان"/><category term="دسته‌بندی"/><category term="دیکشنری"/><category term="زبانشناسی"/><category term="سایت"/><category term="سوئد"/><category term="شباهت"/><category term="شورای عالی اطلاع رسانی"/><category term="عربی"/><category term="فرانسه"/><category term="فرهنگستان زبان فارسی"/><category term="فوق لیسانس"/><category term="فیلم"/><category term="لاتین"/><category term="مبدل پینگلیش"/><category term="مترجم پارس"/><category term="معرفی سرویس"/><category term="معرفی کتاب"/><category term="موبایل"/><category term="موتور جستجو"/><category term="نقد"/><category term="نویسه‌گردانی"/><category term="وبلاگ، پردازش زبان طبیعی"/><category term="پردازش آماری"/><category term="پردازش متن"/><category term="پست‌داک"/><category term="کاربرد پردازش زبان طبیعی"/><category term="کامپیوتر"/><category term="کتاب"/><category term="کلاس درس"/><title type='text'> پردازش زبان‌طبیعی</title><subtitle type='html'>معرفی آخرین روشهای مطرح در حوزه پردازش زبان طبیعی&#xa;</subtitle><link rel='http://schemas.google.com/g/2005#feed' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/posts/default'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default?redirect=false'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/'/><link rel='hub' href='http://pubsubhubbub.appspot.com/'/><link rel='next' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default?start-index=26&amp;max-results=25&amp;redirect=false'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><generator version='7.00' uri='http://www.blogger.com'>Blogger</generator><openSearch:totalResults>120</openSearch:totalResults><openSearch:startIndex>1</openSearch:startIndex><openSearch:itemsPerPage>25</openSearch:itemsPerPage><entry><id>tag:blogger.com,1999:blog-6112737.post-3207414543635174659</id><published>2016-08-20T22:51:00.001+02:00</published><updated>2016-08-20T22:51:45.028+02:00</updated><title type='text'></title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;blockquote class=&quot;twitter-tweet&quot; data-lang=&quot;en&quot;&gt;
&lt;div dir=&quot;ltr&quot; lang=&quot;en&quot;&gt;
Word is defined as a sum of its ngram embeddings in &lt;a href=&quot;https://twitter.com/hashtag/fastText?src=hash&quot;&gt;#fastText&lt;/a&gt; &lt;a href=&quot;https://t.co/8K4Oy9H056&quot;&gt;https://t.co/8K4Oy9H056&lt;/a&gt;&lt;/div&gt;
— Reza (@arezae) &lt;a href=&quot;https://twitter.com/arezae/status/767101506227150849&quot;&gt;August 20, 2016&lt;/a&gt;&lt;/blockquote&gt;
&lt;script async=&quot;&quot; charset=&quot;utf-8&quot; src=&quot;//platform.twitter.com/widgets.js&quot;&gt;&lt;/script&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/3207414543635174659/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/3207414543635174659?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/3207414543635174659'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/3207414543635174659'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2016/08/word-is-defined-as-sum-of-its-ngram.html' title=''/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-8796172086687591899</id><published>2016-04-13T15:30:00.003+02:00</published><updated>2016-04-13T15:41:37.936+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="ایران"/><category scheme="http://www.blogger.com/atom/ns#" term="سایت"/><category scheme="http://www.blogger.com/atom/ns#" term="نقد"/><title type='text'>آیا پایگاه اسناد و مدارک علمی می‌تونه موفق باشه؟</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjQQ7bn7LZkqWJ4UPubJPNDfYvT3bljiYWAJbYtBpI252JMX1zHr4CNWAYs_PNXuDESK-kAcFC5kPPfbCcuQEH33dmhqIhH3ieBemmyH38hAWe0HH6-PWU0hGobInxCsqFUmgAC/s1600/scienceIndex.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;152&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjQQ7bn7LZkqWJ4UPubJPNDfYvT3bljiYWAJbYtBpI252JMX1zHr4CNWAYs_PNXuDESK-kAcFC5kPPfbCcuQEH33dmhqIhH3ieBemmyH38hAWe0HH6-PWU0hGobInxCsqFUmgAC/s400/scienceIndex.png&quot; width=&quot;400&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
با &lt;a href=&quot;http://www.scienceindex.ir/&quot; target=&quot;_blank&quot;&gt;پایگاه اسناد و مدارک علمی&lt;/a&gt; امروز از طریق ایمیل آشنا شدم. در صفحه اول سایت (عکس بالا) نوشته شده بود که ۶۶ درصد محتوای سایت رایگان هست. با توجه به زمینه کاری در مورد ترجمه ماشینی در سایت پایگاه اسناد و مدارک علمی جستجو کردم. حداقل در مورد جستجوی ترجمه ماشینی و در بین ۱۰ نتیجه اول ۸۰ درصد اون پولی بود و تنها ۲۰ درصد رایگان بود.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiwNJDkY6FPtNhfcjvXELUOG5lukOKPdTQor6UN7BuSjQHY84K8WC03_sv0XozKvcmJ3nbjs0lINIqTfzHKZhrmIdsFdTMHImgHJPzaXXUTVBbGUmiOxateuEnh5i2kRUJoBBiR/s1600/scienceIndex-MT.png&quot; imageanchor=&quot;1&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;380&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiwNJDkY6FPtNhfcjvXELUOG5lukOKPdTQor6UN7BuSjQHY84K8WC03_sv0XozKvcmJ3nbjs0lINIqTfzHKZhrmIdsFdTMHImgHJPzaXXUTVBbGUmiOxateuEnh5i2kRUJoBBiR/s400/scienceIndex-MT.png&quot; width=&quot;400&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
تصور می‌کنم که اطلاعات آماری ارائه شده در سایت بصورت کلی درست هست اما احتمالا نسبت ۸۰/۲۰ در مورد بیشتر مطالب مهم بیشتر صدق می‌کنه.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: center;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/8796172086687591899/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/8796172086687591899?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/8796172086687591899'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/8796172086687591899'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2016/04/blog-post.html' title='آیا پایگاه اسناد و مدارک علمی می‌تونه موفق باشه؟'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjQQ7bn7LZkqWJ4UPubJPNDfYvT3bljiYWAJbYtBpI252JMX1zHr4CNWAYs_PNXuDESK-kAcFC5kPPfbCcuQEH33dmhqIhH3ieBemmyH38hAWe0HH6-PWU0hGobInxCsqFUmgAC/s72-c/scienceIndex.png" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-7065644274437051456</id><published>2014-12-18T09:40:00.002+01:00</published><updated>2015-10-06T10:04:23.767+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="داده کاوی"/><category scheme="http://www.blogger.com/atom/ns#" term="پردازش متن"/><title type='text'>TF-IDF</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgs9UppvwJHsWHeF833fpMSAgU4kUQGOXQkPJeyrjqQNOMbhHhc7UthClR1zTxUkDAYkVn6eLG7t0QLPQlouGQQdsB-QtV1ROgnyh7PTLBPiWbi28ewxEDajYvL8IddyYVT75Oc/s1600/tf-idf.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgs9UppvwJHsWHeF833fpMSAgU4kUQGOXQkPJeyrjqQNOMbhHhc7UthClR1zTxUkDAYkVn6eLG7t0QLPQlouGQQdsB-QtV1ROgnyh7PTLBPiWbi28ewxEDajYvL8IddyYVT75Oc/s1600/tf-idf.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
امروز به مطلبی در مورد پیدا کردن کلمه‌های با اهمیت در یک پیکره برخورد کردم که خیلی ساده دلیل استفاده از TF-IDF را توضیح داده بود. اینکه TF &amp;nbsp; می‌تونه کمک کنه که واژه‌های مهم در سطح یک document را پیدا کنیم و IDF هم به ما نشون میده که از بین همه این کلمه‌های پرتکرار کدامیک مهمتر هستند.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;a href=&quot;http://trimc-nlp.blogspot.fr/2013/04/tfidf-with-google-n-grams-and-pos-tags.html&quot; target=&quot;_blank&quot;&gt;در مورد تی‌اف-آی‌دی‌اف (TF-IDF)&lt;/a&gt;&amp;nbsp;و پیکره گوگل&lt;br /&gt;
&lt;br /&gt;
&lt;a href=&quot;https://www.youtube.com/watch?v=a50Hv_N-yHA&quot; target=&quot;_blank&quot;&gt;ویدیو آموزشی tf-idf - دانشگاه استنفورد&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/7065644274437051456/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/7065644274437051456?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/7065644274437051456'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/7065644274437051456'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/12/tf-idf.html' title='TF-IDF'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgs9UppvwJHsWHeF833fpMSAgU4kUQGOXQkPJeyrjqQNOMbhHhc7UthClR1zTxUkDAYkVn6eLG7t0QLPQlouGQQdsB-QtV1ROgnyh7PTLBPiWbi28ewxEDajYvL8IddyYVT75Oc/s72-c/tf-idf.png" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-2047028234270366077</id><published>2014-12-12T15:23:00.002+01:00</published><updated>2014-12-12T15:24:53.306+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="عربی"/><title type='text'>زبان عربی قدیم - بدون نقطه و اِعراب</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
امروز در &lt;a href=&quot;http://en.wikipedia.org/wiki/Arabic_alphabet&quot; target=&quot;_blank&quot;&gt;ویکیپدیا&lt;/a&gt; به مطلبی در مورد زبان عربی برخورد کردم که برای من عجیب بود. مطلب در مورد نگارشهای مختلف زبان عربی بود. ظاهرا در زمانیها قدیم در زبان عربی نه نقطه‌ای وجود داشته و نه اعرابی. نمونه نوشته شده زیر در زمانهای مختلف را می‌توانید در عکس زیر ببینید:&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;table align=&quot;center&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;margin-left: auto; margin-right: auto; text-align: center;&quot;&gt;&lt;tbody&gt;
&lt;tr&gt;&lt;td style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;http://upload.wikimedia.org/wikipedia/commons/thumb/7/7f/Arabic_script_evolution.svg/375px-Arabic_script_evolution.svg.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: auto; margin-right: auto;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;http://upload.wikimedia.org/wikipedia/commons/thumb/7/7f/Arabic_script_evolution.svg/375px-Arabic_script_evolution.svg.png&quot; height=&quot;320&quot; width=&quot;285&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;text-align: center;&quot;&gt;نگارشهای مختلف بسم‌الله ارحمن الرحیم&amp;nbsp;&lt;/td&gt;&lt;/tr&gt;
&lt;/tbody&gt;&lt;/table&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اولین خط مربوط به خط عربی کوفی است که در قرن ۹ استفاده می‌شده است. حذف اعراب از زبان عربی به تنهائی پردازش متن را مشکل می‌کند برای اینکه مدل کامگیوتری ما &amp;nbsp;باید بتواند در جمله را تجزیه و تحلیل کرده و بر اساس نقش هر کلمه اعراب آنرا حدس بزند. حال اگر نقطه را هم حذف کنیم، پیچیدگی زبان عربی بیشتر خواهد شد.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;http://upload.wikimedia.org/wikipedia/commons/thumb/2/21/Basmala_kufi.svg/1280px-Basmala_kufi.svg.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;http://upload.wikimedia.org/wikipedia/commons/thumb/2/21/Basmala_kufi.svg/1280px-Basmala_kufi.svg.png&quot; height=&quot;118&quot; width=&quot;400&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
مثلا دیگه فرقی بین ب و ن در زبان عربی نخواهد بود. آیا بنظر شما با توجه به اینکه زبان فارسی از سیستم مشابه زبان عربی برای نوشتن استفاده می‌کند، چنین تغییری در زبان فارسی هم اتفاق افتاده است؟&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;b&gt;لینکهای مرتبط&lt;/b&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;ul dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;li&gt;&lt;a href=&quot;http://en.wikipedia.org/wiki/Arabic_alphabet&quot; target=&quot;_blank&quot;&gt;الفبای عربی&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;http://commons.wikimedia.org/wiki/File:Arabic_script_evolution.svg&quot; target=&quot;_blank&quot;&gt;تغییرات دستخط عربی&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/2047028234270366077/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/2047028234270366077?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/2047028234270366077'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/2047028234270366077'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/12/blog-post.html' title='زبان عربی قدیم - بدون نقطه و اِعراب'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-5796051356693471043</id><published>2014-09-03T09:48:00.000+02:00</published><updated>2014-09-10T15:31:26.140+02:00</updated><title type='text'>مبدل متن به دست‌خط</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;table align=&quot;center&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;margin-left: auto; margin-right: auto; text-align: center;&quot;&gt;&lt;tbody&gt;
&lt;tr&gt;&lt;td style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEglmCk4x8sq8W8-XyokJWGlHBOCpBJvjResdbXhb4Ifi9DzJkOZywoXgtkYX1rAx3zo5NdNMmsqHsbdV5iIDwDExr8iGxmJMfx_QcU5hyphenhyphenYVbXWW-LQWsuCzGjW1jtHZNCM_GH89/s1600/82772_365.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: auto; margin-right: auto;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEglmCk4x8sq8W8-XyokJWGlHBOCpBJvjResdbXhb4Ifi9DzJkOZywoXgtkYX1rAx3zo5NdNMmsqHsbdV5iIDwDExr8iGxmJMfx_QcU5hyphenhyphenYVbXWW-LQWsuCzGjW1jtHZNCM_GH89/s1600/82772_365.jpg&quot; height=&quot;212&quot; width=&quot;320&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;text-align: center;&quot;&gt;من آقای خوش‌خطی هستم&lt;/td&gt;&lt;/tr&gt;
&lt;/tbody&gt;&lt;/table&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;div style=&quot;text-align: justify;&quot;&gt;
همیشه صحبت از استفاده از مدلهای یادگیری ماشین برای تشخیص دست‌خط بوده، اما اینبار گروهی از محققان دانشگاه تورنتو مدلی ارائه کرده‌اند که می‌تونه متن نوشته شده را به دست‌خط شما تبدیل کنه. تصور کنید که می‌خواهید متنی با دست‌خط خودتان داشته باشید اما با توجه به اینکه اینروزها نوشتن روی کاغذ کار ساده‌ای نیست، از انجام اینکار صرفنظر می‌کنید. اما اگر این برنامه را داشته باشید می‌توانید متن را تایپ کرده و در نهایت آنرا با دست‌خط خودتان داشته باشید.&lt;/div&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;table align=&quot;center&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;margin-left: auto; margin-right: auto; text-align: center;&quot;&gt;&lt;tbody&gt;
&lt;tr&gt;&lt;td style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiySDp-cBCEoC4ljTdCfXrwGLCsxXf0vTA5jhKO7cHFSyEPf9St-pnsRh-WhmFz8f718TQo8HgqG5-rj_MiPCTllsj5U8HmOklpZCUoC7A3ynMtwcKd3LUmS0spXFm7lydfEd-V/s1600/hw.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: auto; margin-right: auto;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiySDp-cBCEoC4ljTdCfXrwGLCsxXf0vTA5jhKO7cHFSyEPf9St-pnsRh-WhmFz8f718TQo8HgqG5-rj_MiPCTllsj5U8HmOklpZCUoC7A3ynMtwcKd3LUmS0spXFm7lydfEd-V/s1600/hw.jpg&quot; height=&quot;31&quot; width=&quot;400&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;text-align: center;&quot;&gt;نمونه متن نوشته شده توسط این برنامه&lt;/td&gt;&lt;/tr&gt;
&lt;/tbody&gt;&lt;/table&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;div style=&quot;text-align: justify;&quot;&gt;
این برنامه را می‌توانید از طریق لینک زیر تست کنید. البته در حال حاضر فقط برای دست‌خطهای موجود به زبان انگلیسی در سیستم اینکار را انجام میده.&lt;/div&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;a href=&quot;http://www.cs.toronto.edu/~graves/handwriting.html&quot;&gt;http://www.cs.toronto.edu/~graves/handwriting.html&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;div style=&quot;text-align: justify;&quot;&gt;
تصور کنید که بتوانید متن خودتان را به دست‌خط فردی که دوست دارید بنویسید. مثلا متن نامه شما با دست‌خط شکسپیر.&lt;br /&gt;
&lt;br /&gt;
&lt;div style=&quot;text-align: center;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div style=&quot;text-align: center;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div style=&quot;text-align: center;&quot;&gt;
&lt;span style=&quot;color: blue;&quot;&gt;&lt;b&gt;چه کاربردهای دیگری برای این تکنولوژی می‌توانید تصور کنید؟&lt;/b&gt;&lt;/span&gt;&lt;/div&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/5796051356693471043/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/5796051356693471043?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/5796051356693471043'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/5796051356693471043'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/09/blog-post.html' title='مبدل متن به دست‌خط'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEglmCk4x8sq8W8-XyokJWGlHBOCpBJvjResdbXhb4Ifi9DzJkOZywoXgtkYX1rAx3zo5NdNMmsqHsbdV5iIDwDExr8iGxmJMfx_QcU5hyphenhyphenYVbXWW-LQWsuCzGjW1jtHZNCM_GH89/s72-c/82772_365.jpg" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-2891962679294401414</id><published>2014-08-06T09:34:00.001+02:00</published><updated>2014-08-11T00:18:38.421+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="برنامه"/><category scheme="http://www.blogger.com/atom/ns#" term="دسته‌بندی"/><category scheme="http://www.blogger.com/atom/ns#" term="شباهت"/><title type='text'>یک برنامه - تشخیص دهنده زبان - Language identification</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiyeKktaefl2-I0uLb_cEeHsm5VujQRX_g6S3QuA0w8tYzKSXoC5pSEeWksaiFaJqvd3BaMSanzm9LNrFHaaoebQJzU0mIx1e1IYa_NuqkdFOB0EIYpxz7KVPR7TwWwjdhzEEOK/s1600/MFL_1.gif&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiyeKktaefl2-I0uLb_cEeHsm5VujQRX_g6S3QuA0w8tYzKSXoC5pSEeWksaiFaJqvd3BaMSanzm9LNrFHaaoebQJzU0mIx1e1IYa_NuqkdFOB0EIYpxz7KVPR7TwWwjdhzEEOK/s1600/MFL_1.gif&quot; height=&quot;266&quot; width=&quot;320&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
یکی از اولین ابزارهای مورد نیاز پروژه‌های پردازش زبان طبیعی چند زبانه، &amp;nbsp;&lt;a href=&quot;https://en.wikipedia.org/wiki/Language_identification&quot; target=&quot;_blank&quot;&gt;تشخیص زبان&lt;/a&gt;&amp;nbsp;محتوای داده شده است. روشهای مختلفی برای اینکار می‌توان استفاده کرد، که ساده‌ترین آن استفاده از مدل &lt;a href=&quot;https://en.wikipedia.org/wiki/N-gram&quot; target=&quot;_blank&quot;&gt;ngram&lt;/a&gt; &amp;nbsp;است. در ادامه این نوشته این مدل را توضیح داده و در نهایت یک برنامه پرل (Perl) براي استفاده شما معرفي می‌كنم.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;مدلی که در اینجا معرفی می‌کنم یک مدل یادگیری بانظارت هست. به این معنی که برای استفاده از اون نیاز به داده برچسب خورده (labeled data) برای آموزش برنامه دارید. مثلا در مورد این پروژه می‌توانید از یک فایل متنی که در هر خط اون یک جمله باشه و آخرین کلمه هم نوع زبان &amp;nbsp;تعریف شده باشه. مثل نمونه‌ای که در زیر به اون اشاره شده:&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div style=&quot;text-align: left;&quot;&gt;
this is a test. &lt;b&gt;en&lt;/b&gt;&lt;/div&gt;
&lt;div style=&quot;text-align: left;&quot;&gt;
je suis contente. &lt;b&gt;fr&lt;/b&gt;&lt;/div&gt;
&lt;div style=&quot;text-align: left;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;b&gt;داده&lt;/b&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
یک راه ساده برای آماده سازی چنین داده‌ای اینه که مجموعه‌ای از جملات انگلیسی را به مترجم گوگل داده و ترجمه اون به زبانهای مختلف را در یک فایل جمع‌آوری کنید. در نهایت باید فایل خودتون را به دو قسمت (بصورت تصادفی ۸۰-۲۰) تقسیم کنید تا بتوانید یک فایل برای آموزش داشته باشید و یکی هم برای ارزیابی نتیجه اون.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;b&gt;مدل&lt;/b&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
مدل استفاده شده در این برنامه character 3-gram هست. به این معنی که هر زبان بر اساس لیستی از رشته‌های ۳تائی از حروف پشت سر هم (3-gram) تعریف شده. این لیست از روی داده آموزشی برای زبان ساخته میشه. در زمان ارزیابی مدل، جمله داده شده به همین صورت تبدیل به حروف ۳تائی میشه و در نهایت فاصله برداری برین جمله داده شده و تمام زبانها اندازه‌گیری میشه. روشهای مختلفی &amp;nbsp;را می‌توان برای اندازه‌گیری فاصله بین دوبردار استفاده کرد. در این پروژه من از روش اندازه گیری بر اساس &lt;a href=&quot;https://en.wikipedia.org/wiki/Cosine_similarity&quot; target=&quot;_blank&quot;&gt;کسینوس زاویه بین دو بردار&lt;/a&gt;&amp;nbsp;استفاده کرده‌ام که معمولا برای بیشتر مدلها جواب میده.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;b&gt;کد برنامه&lt;/b&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
سورس کد برنامه را می‌توانید از آدرس زیر دانلود کنید. اگر با جیت‌هاب آشنا باشید براحتی می‌توانید کد برنامه را روی سیستم خودتون کپی کنید. اگر هم موردی داشت که نیاز به تصحیح داشت می‌توانید در همینجا اعلام کنید یا اینکه در أدرس داده شده مطرح کنید.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;u&gt;&lt;a href=&quot;https://code.google.com/p/language-classifier/source/browse/classify.pl&quot;&gt;https://code.google.com/p/language-classifier/source/browse/classify.pl&lt;/a&gt;&lt;/u&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اگر مشکلی در متصل شدن به &lt;a href=&quot;https://code.google.com/&quot; target=&quot;_blank&quot;&gt;گوگل‌کد&lt;/a&gt; داشتید به من خبر بدین که برنامه را برای شما بفرستم.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/2891962679294401414/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/2891962679294401414?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/2891962679294401414'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/2891962679294401414'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/08/language-identification.html' title='یک برنامه - تشخیص دهنده زبان - Language identification'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiyeKktaefl2-I0uLb_cEeHsm5VujQRX_g6S3QuA0w8tYzKSXoC5pSEeWksaiFaJqvd3BaMSanzm9LNrFHaaoebQJzU0mIx1e1IYa_NuqkdFOB0EIYpxz7KVPR7TwWwjdhzEEOK/s72-c/MFL_1.gif" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-6861981901377797961</id><published>2014-07-30T10:04:00.000+02:00</published><updated>2014-08-06T09:36:30.449+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="آمستردام"/><category scheme="http://www.blogger.com/atom/ns#" term="اروپا"/><category scheme="http://www.blogger.com/atom/ns#" term="بورس دکترا"/><category scheme="http://www.blogger.com/atom/ns#" term="ترجمه ماشینی"/><category scheme="http://www.blogger.com/atom/ns#" term="زبانشناسی"/><category scheme="http://www.blogger.com/atom/ns#" term="پست‌داک"/><title type='text'>دکترا و پست دکترا - ترجمه ماشینی - آمستردام - هلند</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjIRFvxmznbtVGgFC9m9pkq5MCRkc3esdo-yY1giQ4jm1-QvdJFbRbmlu_J-R9wbokmtJS4Uk5M5ykMB8c8Mi0-EkI2Fw6hzVMowJFtpfxR5fbmV1VdEwo6re6iY9ZttqG-ewDy/s1600/University-of-Amsterdam-logo.gif&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjIRFvxmznbtVGgFC9m9pkq5MCRkc3esdo-yY1giQ4jm1-QvdJFbRbmlu_J-R9wbokmtJS4Uk5M5ykMB8c8Mi0-EkI2Fw6hzVMowJFtpfxR5fbmV1VdEwo6re6iY9ZttqG-ewDy/s1600/University-of-Amsterdam-logo.gif&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;br /&gt;
تعدادی بورس دکترا و یک فرصت پست داک در زمینه ترجمه ماشینی آماری در دانشگاه آمستردام هلند برای سال ۲۰۱۵ ارائه شده که می‌توانید اطلاعات بیشتر را از طریق &lt;a href=&quot;https://groups.google.com/forum/#!forum/NLP-dilmaj&quot; target=&quot;_blank&quot;&gt;گروه دیلماج&lt;/a&gt; گوگل ببینید.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;ul style=&quot;text-align: right;&quot;&gt;
&lt;li&gt;&lt;a href=&quot;https://groups.google.com/d/msg/nlp-dilmaj/FYQRg9V0WJs/HlRc0QSAcuAJ&quot; target=&quot;_blank&quot;&gt;دکترا - زبانشناسی محاسباتی - دانشگاه آمستردام - هلند&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;https://groups.google.com/d/msg/nlp-dilmaj/HFy_LR8FUv0/OGChOxDcbaUJ&quot; target=&quot;_blank&quot;&gt;پست‌داک - ترجمه ماشینی آماری - دانشگاه آمستردام - هلند&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/6861981901377797961/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/6861981901377797961?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/6861981901377797961'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/6861981901377797961'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/07/Statistical-Machine-Translation-PhD-PostDoc-Amsterdam.html' title='دکترا و پست دکترا - ترجمه ماشینی - آمستردام - هلند'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjIRFvxmznbtVGgFC9m9pkq5MCRkc3esdo-yY1giQ4jm1-QvdJFbRbmlu_J-R9wbokmtJS4Uk5M5ykMB8c8Mi0-EkI2Fw6hzVMowJFtpfxR5fbmV1VdEwo6re6iY9ZttqG-ewDy/s72-c/University-of-Amsterdam-logo.gif" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-2027917540378830754</id><published>2014-07-26T15:46:00.001+02:00</published><updated>2014-07-26T23:54:23.999+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="ترجمه ماشینی"/><category scheme="http://www.blogger.com/atom/ns#" term="شورای عالی اطلاع رسانی"/><title type='text'> مترجم ماشینی - شورای عالی اطلاع رسانی</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEggGFKLFU5DR3-5foTH6Onb-0ah2IXHFztaNDHGBydheJloO-2vjoI3frYQXNNuyFUA_Yi8aQVcb6Q6GxJn6vr4pH7uglHuv76GnnobTFk1qVlKtUEPbB-7cbRDDZHMK8VD1M3W/s1600/EuropeFlags.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEggGFKLFU5DR3-5foTH6Onb-0ah2IXHFztaNDHGBydheJloO-2vjoI3frYQXNNuyFUA_Yi8aQVcb6Q6GxJn6vr4pH7uglHuv76GnnobTFk1qVlKtUEPbB-7cbRDDZHMK8VD1M3W/s1600/EuropeFlags.jpg&quot; height=&quot;206&quot; width=&quot;320&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
ترجمه ماشینی - شورای عالی اطلاع رسانی را می‌توانید از لینک زیر تست کنید. تا جائیکه تست کردم نتیجه خوبی نشون نمی‌ده. ظاهرا از یکی از ابزارهای اوپن سورس استفاده شده و با کمک پیکره موازی که احتمالا با کمک مترجم گوگل تهیه شده اونو آموزش داده‌اند.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;a href=&quot;http://machinetranslation.ir/&quot;&gt;http://machinetranslation.ir&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در یک پست جدا در مورد اینکه چطور میشه اینکار را انجام داد می‌نویسم. اینکه کلا اینکار کمتر از یک هفته طول میکشه برای یک نفر که بتونه چند تا برنامه نصب کنه.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
برای شروع می‌تونید ببینید که پروژه مترجم ماشنی اتحادیه اروپا تمام برنامه‌ها و پیکره‌های موازی را بصورت تقریبا رایگان در اختیار همه گذاشته و از طریق لینک زیر برای همه قابل استفاده است.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;a href=&quot;http://www.statmt.org/&quot;&gt;http://www.statmt.org&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/2027917540378830754/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/2027917540378830754?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/2027917540378830754'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/2027917540378830754'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/07/machine-translation.html' title=' مترجم ماشینی - شورای عالی اطلاع رسانی'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEggGFKLFU5DR3-5foTH6Onb-0ah2IXHFztaNDHGBydheJloO-2vjoI3frYQXNNuyFUA_Yi8aQVcb6Q6GxJn6vr4pH7uglHuv76GnnobTFk1qVlKtUEPbB-7cbRDDZHMK8VD1M3W/s72-c/EuropeFlags.jpg" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-8944481245079099665</id><published>2014-07-22T13:20:00.002+02:00</published><updated>2014-07-22T14:27:06.114+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="زبان فارسی"/><category scheme="http://www.blogger.com/atom/ns#" term="لاتین"/><category scheme="http://www.blogger.com/atom/ns#" term="نویسه‌گردانی"/><title type='text'>لاتین نویسی زبان فارسی</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjETupzBw9hYfUZ2TbhhQVeH0VELIwwg6ZBIjdTveg_H2XWCvfDV4cF1RTBuCGBIDhUGrLeYBEifLt2KIQjjMvzCqDsOVy_tD7uiYe6F1lOtCChTWvMgLL9aH_4mf3VzjVQDfJv/s1600/images.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjETupzBw9hYfUZ2TbhhQVeH0VELIwwg6ZBIjdTveg_H2XWCvfDV4cF1RTBuCGBIDhUGrLeYBEifLt2KIQjjMvzCqDsOVy_tD7uiYe6F1lOtCChTWvMgLL9aH_4mf3VzjVQDfJv/s1600/images.jpg&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
&amp;nbsp; &amp;nbsp;لاتین نویسی زبان فارسی یکی از پروژه‌هائی است که می‌تواند مورد توجه محققان در زمینه پردازش زبان طبیعی قرار بگیرد. پروژه‌های مشابه با نام &lt;a href=&quot;https://fa.wikipedia.org/wiki/%D9%86%D9%88%DB%8C%D8%B3%D9%87%E2%80%8C%DA%AF%D8%B1%D8%AF%D8%A7%D9%86%DB%8C&quot; target=&quot;_blank&quot;&gt;نویسه‌گردانی&lt;/a&gt; (&lt;a href=&quot;https://en.wikipedia.org/wiki/Transliteration&quot; target=&quot;_blank&quot;&gt;transliteration&lt;/a&gt;) در زبانهای مختلف تعریف شده که بیشتر برای تبدیل متن (در یک زبان) از یک خط به خط لاتین بوده است. بعنوان مثال می‌توان برای زبان ترکی آذربایجان متون را به سه خط عربی، &lt;a href=&quot;https://fa.wikipedia.org/wiki/%D8%A7%D9%84%D9%81%D8%A8%D8%A7%DB%8C_%D8%B3%DB%8C%D8%B1%DB%8C%D9%84%DB%8C%DA%A9&quot; target=&quot;_blank&quot;&gt;سیریلیک&lt;/a&gt; و لاتین دید. در ادامه متن، تعدادی از ابزارهای تبدیل بین خط فارسی و لاتین معرفی شده و استاندارهای قابل استفاده برای اینکار نیز معرفی شده‌اند.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
&amp;nbsp; &amp;nbsp;در زبان فارسی هم ابزارهای مختلفی برای نویسه‌گردانی از لاتین به فارسی ارائه شده است که بیشتر کاربرد تبدیل خط پینگلیش به فارسی را دارد. بعنوان مثال می‌توان به برنامه‌های&amp;nbsp;&lt;a href=&quot;http://www.behnevis.com/&quot; target=&quot;_blank&quot;&gt;بهنویس&lt;/a&gt;، &lt;a href=&quot;http://blog.dilmaj.net/p/blog-page_22.html&quot; target=&quot;_blank&quot;&gt;نویسه‌گردان گوگل&lt;/a&gt; و &lt;a href=&quot;http://virastyar.ir/trans/index&quot; target=&quot;_blank&quot;&gt;ترانویس&lt;/a&gt;&amp;nbsp;اشاره کرد. چنین برنامه‌هائی برای تعدادی از کاربران فارسی‌زبان که عادت دارند به پینگلیش بنویسند خیلی مفید بوده است. &lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
اما کمتر برنامه‌ای تا الان برای تبدیل خط فارسی به لاتین ارائه شده است. شاید یکی از دلایل ارائه نشدن چنین ابزاری، نبود بازار مناسب برای آن باشد. در حال حاضر و با وجود فارسی‌زبانهائی که قادر به خواندن متون فارسی به خط فارسی نیستند، بازار مناسب ایجاد شده است. اما مشکلات دیگری هم برای ارائه چنین برنامه‌هائی وجود دارد. با توجه به اینکه صداهادر خط فارسی نوشته نمی‌شوند، نمی‌توان بسادگی با جایگزینی حروف فارسی با لاتین تبدیل را انجام داد. ابهامات زیادی هست که نیاز به استفاده از الگوریتمهای پیچیده‌تری نسبت به مبدل لاتین به فارسی هست. ابهاماتی مانند کلمه -حسن- یا -در- که بسته به معنی آن در جمله، می‌تواند تلفظ‌های متفاوتی داشته باشد.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
در حال حاضر پروژه‌ای زیر نظر دبیرخانه شورای عالی اطلاع رسانی در این‌زمینه در حال انجام است که یکی از خروجی‌های آن نویسه‌گردانی فارسی به لاتین هست. در این پروژه که با نام &lt;a href=&quot;http://virastyar.ir/&quot; target=&quot;_blank&quot;&gt;ویراستیار&lt;/a&gt; ارائه شده، ادعا شده که برنامه بصورت رایگان و کد باز (هرچند در سایت ویراستیار خبری از ارائه کد برنامه نیست) خواهد بود. &amp;nbsp;در حال حاضر برنامه ویراستیار علاوه بر نسخه اجرائی قابل استفاده در برنامه آفیس ویندوز، بصورت آنلاین هم در آدرس&amp;nbsp;&lt;a href=&quot;http://virastyar.com/virastlive/index.html&quot; target=&quot;_blank&quot;&gt;ویراست لایو&lt;/a&gt;&amp;nbsp;ارائه شده است.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
&amp;nbsp; &amp;nbsp;اما شاید اولین قدم برای تبدیل خط فارسی به لاتین، تعریف خط لاتین باشد بطوریکه بتواند با کمترین مشکل برای پردازش زبان طبیعی قابل استفاده باشد. در حال حاضر ۳ مدل مختلف برای تعریف خط لاتین فارسی تعریف شده که در زیر به آنها اشاره شده است:&lt;/div&gt;
&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;ul dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;li&gt;&lt;a href=&quot;http://unipers.com/&quot; target=&quot;_blank&quot;&gt;یونی‌پرس&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;http://www.persiandirect.com/projects/ipa2/ipa2_tutor.htm&quot; target=&quot;_blank&quot;&gt;پرسیک&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;http://fa.alefbaye2om.org/&quot; target=&quot;_blank&quot;&gt;الفبای دوم&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
&lt;span style=&quot;color: #141412; font-family: Source Sans Pro, Tahoma, Tahoma, Helvetica, sans-serif;&quot;&gt;&lt;span style=&quot;background-color: white; line-height: 24px;&quot;&gt;از بین ۳ مدل ارائه شده، فقط پروژه الفبای دوم هست که می‌خواهد خط فارسی و خط لاتین را در کنار هم استفاده کند تا بتواند بخشی از مشکلات آموزش زبان فارسی را حل کند و دوتای اول قصد دارند جایگزین خط فارسی بشوند ( که بنظر من منطقی نیست ).&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;
&lt;span style=&quot;color: #141412; font-family: Source Sans Pro, Tahoma, Tahoma, Helvetica, sans-serif;&quot;&gt;&lt;span style=&quot;background-color: white; line-height: 24px;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;
&lt;span style=&quot;color: #141412; font-family: Source Sans Pro, Tahoma, Tahoma, Helvetica, sans-serif;&quot;&gt;&lt;span style=&quot;background-color: white; line-height: 24px;&quot;&gt;لینکهای مرتبط&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;
&lt;br /&gt;
&lt;ul&gt;
&lt;li&gt;&lt;span style=&quot;color: #141412; font-family: Source Sans Pro, Tahoma, Tahoma, Helvetica, sans-serif;&quot;&gt;&lt;span style=&quot;line-height: 24px;&quot;&gt;&lt;a href=&quot;http://geonames.ncc.org.ir/_icnsgn/Documents/%D8%B4%DB%8C%D9%88%D9%87%20%D9%86%D8%A7%D9%85%D9%87%20%D8%A2%D9%88%D8%A7%D9%86%DA%AF%D8%A7%D8%B1%DB%8C_20130327_083742.pdf&quot; target=&quot;_blank&quot;&gt;دستورالعمل آوانگاری نام های جغرافیایی ایران&lt;/a&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/li&gt;
&lt;li&gt;&lt;span style=&quot;color: #141412; font-family: Source Sans Pro, Tahoma, Tahoma, Helvetica, sans-serif;&quot;&gt;&lt;span style=&quot;line-height: 24px;&quot;&gt;&lt;a href=&quot;http://isna.ir/fa/news/91122113926/%D8%A7%D8%A8%D9%84%D8%A7%D8%BA-%D8%B4%DB%8C%D9%88%D9%87-%D9%86%D8%A7%D9%85%D9%87-%D8%A2%D9%88%D8%A7%D9%86%DA%AF%D8%A7%D8%B1%DB%8C-%DA%A9%D9%84%DB%8C-%D9%86%D8%A7%D9%85-%D9%87%D8%A7%DB%8C-%D8%AC%D8%BA%D8%B1%D8%A7%D9%81%DB%8C%D8%A7%DB%8C%DB%8C&quot; target=&quot;_blank&quot;&gt;ایسنا - ابلاغ شیوه‌نامه آوانگاری کلی نام‌های جغرافیایی ایران&lt;/a&gt;&lt;/span&gt;&lt;/span&gt;&lt;/li&gt;
&lt;li&gt;&lt;span style=&quot;color: #141412; font-family: Source Sans Pro, Tahoma, Tahoma, Helvetica, sans-serif;&quot;&gt;&lt;a href=&quot;https://fa.wikipedia.org/wiki/%D8%A7%D9%84%D9%81%D8%A8%D8%A7%DB%8C_%D8%A2%D9%88%D8%A7%D9%86%DA%AF%D8%A7%D8%B1%DB%8C_%D8%A8%DB%8C%D9%86%E2%80%8C%D8%A7%D9%84%D9%85%D9%84%D9%84%DB%8C&quot; target=&quot;_blank&quot;&gt;الفبای آوانگاری بین‌المللی&lt;/a&gt;&lt;/span&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/8944481245079099665/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/8944481245079099665?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/8944481245079099665'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/8944481245079099665'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/07/transliteration-farsi.html' title='لاتین نویسی زبان فارسی'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjETupzBw9hYfUZ2TbhhQVeH0VELIwwg6ZBIjdTveg_H2XWCvfDV4cF1RTBuCGBIDhUGrLeYBEifLt2KIQjjMvzCqDsOVy_tD7uiYe6F1lOtCChTWvMgLL9aH_4mf3VzjVQDfJv/s72-c/images.jpg" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-8685094570244469786</id><published>2014-07-16T12:04:00.002+02:00</published><updated>2014-07-16T12:06:20.666+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="پردازش زبان طبیعی"/><category scheme="http://www.blogger.com/atom/ns#" term="پیکره"/><title type='text'>پیکره‌های فارسی</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div style=&quot;text-align: center;&quot;&gt;
&lt;iframe frameborder=&quot;0&quot; marginheight=&quot;0&quot; marginwidth=&quot;0&quot; scrolling=&quot;no&quot; src=&quot;//ws-na.amazon-adsystem.com/widgets/q?ServiceVersion=20070822&amp;amp;OneJS=1&amp;amp;Operation=GetAdHtml&amp;amp;MarketPlace=US&amp;amp;source=ac&amp;amp;ref=tf_til&amp;amp;ad_type=product_link&amp;amp;tracking_id=computatlingu-20&amp;amp;marketplace=amazon&amp;amp;region=US&amp;amp;placement=0262133601&amp;amp;asins=0262133601&amp;amp;linkId=PO3WAINEG2M5Z2DS&amp;amp;show_border=true&amp;amp;link_opens_in_new_window=true&quot; style=&quot;height: 240px; width: 120px;&quot;&gt;
&lt;/iframe&gt;
&lt;/div&gt;
&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;b style=&quot;font-size: x-large;&quot;&gt;تعریف&lt;/b&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;div style=&quot;text-align: justify;&quot;&gt;
پیکره &amp;nbsp;متنی (&lt;a href=&quot;https://en.wikipedia.org/wiki/Text_corpus&quot; target=&quot;_blank&quot;&gt;corpus&lt;/a&gt;) مجموعه‌ای بزرگ و بدون ساختار از متون تولید شده توسط انسان است. از پیکره برای آموزش یا ارزیابی مدلهای پردازش زبان طبیعی استفاده می‌شود. پیکره می‌تواند یک زبانه یا چند زبانه باشد. در صورتیکه در پیکره چند زبانه ارتباطی بین جملات زبانهای مختلف تعریف شده باشد، به آن &lt;a href=&quot;http://blog.dilmaj.net/2014/07/Euro-Corpus-Translation-Memory.html&quot; target=&quot;_blank&quot;&gt;پیکره موازی&lt;/a&gt; می‌گویند که کاربر بیشتر آن در &lt;a href=&quot;https://fa.wikipedia.org/wiki/%D8%AA%D8%B1%D8%AC%D9%85%D9%87_%D9%85%D8%A7%D8%B4%DB%8C%D9%86%DB%8C&quot; target=&quot;_blank&quot;&gt;ترجمه ماشینی&lt;/a&gt; است.&lt;/div&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;div style=&quot;text-align: justify;&quot;&gt;
قبلا در مورد پیکره‌های موجود در زبانهای غیر از فارسی نوشته‌بودم (&lt;a href=&quot;http://blog.dilmaj.net/2014/07/Euro-Corpus-Translation-Memory.html&quot; target=&quot;_blank&quot;&gt;حافظه ترجمه&lt;/a&gt;، &lt;a href=&quot;http://blog.dilmaj.net/2014/07/hamshahri-online-corpus-zwnj-analysis.html&quot; target=&quot;_blank&quot;&gt;همشهری‌ آن‌لاین&lt;/a&gt;) . در این نوشته قصد دارم دو تا &amp;nbsp;از مهمترین پیکره‌های موجود در زبان فارسی را معرفی کنم.&lt;/div&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;span style=&quot;font-size: large;&quot;&gt;&lt;b&gt;&lt;br /&gt;&lt;/b&gt;&lt;/span&gt;
&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;span style=&quot;font-size: large;&quot;&gt;&lt;b&gt;&lt;a href=&quot;http://ece.ut.ac.ir/dbrg/bijankhan/&quot; target=&quot;_blank&quot;&gt;پیکره بی‌جن‌خان&lt;/a&gt;&amp;nbsp;&lt;/b&gt;&lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;div style=&quot;text-align: justify;&quot;&gt;
یکی از قدیمی‌ترین پیکره‌های زبان فارسی که به همت آقای دکتر بی‌جن‌خان و با حمایت مالی سازمانهای مختلف دولتی در دانشگاه تهران تهیه شده است. این پیکره شامل &lt;a href=&quot;https://fa.wikipedia.org/wiki/%D8%A8%D8%B1%DA%86%D8%B3%D8%A8%E2%80%8C%D8%B2%D9%86%DB%8C_%D8%A7%D8%AC%D8%B2%D8%A7%DB%8C_%DA%A9%D9%84%D8%A7%D9%85&quot; target=&quot;_blank&quot;&gt;برچسب‌های دستوری&lt;/a&gt; (&lt;a href=&quot;https://en.wikipedia.org/wiki/Part-of-speech_tagging&quot; target=&quot;_blank&quot;&gt;Part-Of-Speech tags&lt;/a&gt;) برای کلمات نیز است. این پیکره بصورت دستی برچسب زنی شده است و به همین دلیل یکی از دقیق‌ترین پیکره‌های موجود برای آموزش یک برچسب زن فارسی است. هرچند بنظر می‌رسد که در حین انجام برچسب‌زنی دستی از ابزارهای خودکار برای تسریع کار استفاده شده است که باعث ایجاد برچسب‌های نادرست در مواردی شده است.&lt;/div&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;a href=&quot;http://www.dadegan.ir/catalog/bijankhan&quot; target=&quot;_blank&quot;&gt;لینک پیکره بی‌جن‌خان در سایت دادگان&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;span style=&quot;font-size: large;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;span style=&quot;font-size: large;&quot;&gt;&lt;b&gt;&lt;a href=&quot;http://www.dadegan.ir/catalog/tep&quot; target=&quot;_blank&quot;&gt;پیکره موازی انگلیسی-فارسی دانشگاه تهران&lt;/a&gt;&lt;/b&gt;&lt;/span&gt; (&lt;a href=&quot;http://wwwusers.di.uniroma1.it/~pilehvar/pubs/CICLING_2011_Pilehvars_Faili.pdf&quot; target=&quot;_blank&quot;&gt;TEP corpus&lt;/a&gt;)&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;div style=&quot;text-align: justify;&quot;&gt;
این پیکره شامل جملات انگلیسی و ترجمه فارسی زیر‌نویس فیلمهای مختلف هست که در قالب یک پیکره ارائه شده‌ است. گروه &lt;a href=&quot;http://ece.ut.ac.ir/lab/nlp?destination=node%2F732&quot; target=&quot;_blank&quot;&gt;پردازش زبان طبیعی دانشگاه تهران &lt;/a&gt;و آقای دکتر فیلی گردآورنده این پیکره بوده‌اند. این پیکره بیشتر برای آموزش یک سیستم ترجمه ماشینی کاربرد دارد.&lt;/div&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;ul dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;li&gt;&lt;a href=&quot;http://opus.lingfil.uu.se/TEP.php&quot; target=&quot;_blank&quot;&gt;اطلاعات بیشتر در مورد پیکره انگلیسی-فارسی دانشگاه تهران&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;http://opus.lingfil.uu.se/download.php?f=TEP/TEP0.1.tar.gz&quot; target=&quot;_blank&quot;&gt;لینک دانلود پیکره انگلیسی-فارسی دانشگاه تهران&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
پیکره‌های دیگری هم برای زبان فارسی وجود دارند که در نوشته‌های بعدی آنها را معرفی خواهم کرد.&lt;/div&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/8685094570244469786/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/8685094570244469786?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/8685094570244469786'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/8685094570244469786'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/07/corpus-farsi-persian.html' title='پیکره‌های فارسی'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-4645737421483202610</id><published>2014-07-12T08:30:00.000+02:00</published><updated>2014-08-06T09:41:21.577+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="زبان فارسی"/><category scheme="http://www.blogger.com/atom/ns#" term="پردازش آماری"/><category scheme="http://www.blogger.com/atom/ns#" term="پیکره"/><title type='text'>پاورچین پاورچین - سلانه سلانه - بع بع - صورت صورت</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;table align=&quot;center&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;margin-left: auto; margin-right: auto; text-align: center;&quot;&gt;&lt;tbody&gt;
&lt;tr&gt;&lt;td style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjIbDsmqImn8sPQ8fDkqH5pSmmIi4Q-AGkr_R1v9JJTC2Rj_emWJBE1QFbJ7klrb00yOwEIx3RPfFuJ0cOpfS_unqoP3Ic5A5gywomD-B1BrMj-apnz6taYheDOBrOK4uB2SDT-/s1600/NastaliqOnline.ir.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: auto; margin-right: auto;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjIbDsmqImn8sPQ8fDkqH5pSmmIi4Q-AGkr_R1v9JJTC2Rj_emWJBE1QFbJ7klrb00yOwEIx3RPfFuJ0cOpfS_unqoP3Ic5A5gywomD-B1BrMj-apnz6taYheDOBrOK4uB2SDT-/s1600/NastaliqOnline.ir.jpg&quot; height=&quot;195&quot; width=&quot;320&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;text-align: center;&quot;&gt;&lt;table align=&quot;center&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;margin-left: auto; margin-right: auto; text-align: center;&quot;&gt;&lt;tbody&gt;
&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;font-size: 13px;&quot;&gt;بسی رنج بردم بدین سال سی&lt;br /&gt;
عجم زنده کردم بدین پارسی&lt;/td&gt;&lt;/tr&gt;
&lt;/tbody&gt;&lt;/table&gt;
&lt;/td&gt;&lt;/tr&gt;
&lt;/tbody&gt;&lt;/table&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در ادامه مباحث مربوط به پردازش پیکره فارسی، به یکی دیگه از مواردی که در پیکره‌های خبری فارسی به‌وفور دیده‌ام می‌پردازیم. و خواهیم دید که چطور میشه با یک مدل ساده چنین مشکلی را در پیکره حل کرد.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در متون فارسی گاهی به کلماتی برخورد می‌کنیم که تکرار پشت‌سر آنها کاملا درست است، مثل کلمات زیر:&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
قاه قاه&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
شرحه شرحه&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
بیگلی بیگلی&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
واق واق&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
کورمال کورمال&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
هق هق&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
زق زق&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
خس خس&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
سلانه سلانه&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اَ اَ&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
کَل کَل&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
یواش یواش&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
بع بع&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
دوان دوان&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
پچ پچ&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
پرسان پرسان&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
نچ نچ&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
فوج فوج&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
تلق تلق&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
کرور کرور&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
پاورچین پاورچین&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
واه واه&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اما آیا همه کلماتی که دوبار پشت‌سر‌هم نوشته شده‌اند، درستن؟ مثلا آیا میشه کلمات زیر را بصورت تکراری نوشت؟&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
صورت صورت&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
نظر نظر&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
باشد باشد&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
انجام انجام&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اگر اگر&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
پس پس&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
نمی نمی&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
آنها آنها&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
شد شد&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
بنظر میاد که ترکیب کلمات بالا صحیح نیست. اما چطور میشه این کلمات را در متن پیدا کرده و تصحیح کرد. یک راه ساده اینه که تعداد تکرار ترکیب دوتائی (&lt;a href=&quot;http://en.wikipedia.org/wiki/Bigram&quot; target=&quot;_blank&quot;&gt;bigram&lt;/a&gt;) را در نظر بگیریم. اما این کافی نیست چرا که کلمات درستی که در ابتدای متن اشاره شد معمولا از تکرار بالائی برخوردار نیستند و نمیشه براحتی اونها را از سری دوم کلمات فقط بر اساس آمار تکرار اونها تشخص داد.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اما راه دوم استفاده از آمار تکرار نسبی است. به این معنی که آمار تکرار دوتائی (&lt;a href=&quot;http://en.wikipedia.org/wiki/Bigram&quot; target=&quot;_blank&quot;&gt;bigram&lt;/a&gt;) را بر تعداد تکرار کلمه تقسیم کنیم. در اینصورت می‌توانید کلماتی که بصورت تنهائی تکرار بالائی دارند (مانند -شد- ) را از کلماتی که تکرار کمتری دارند ( مانند -بع- ) جدا کرد. &amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/4645737421483202610/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/4645737421483202610?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/4645737421483202610'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/4645737421483202610'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/07/blog-post.html' title='پاورچین پاورچین - سلانه سلانه - بع بع - صورت صورت'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjIbDsmqImn8sPQ8fDkqH5pSmmIi4Q-AGkr_R1v9JJTC2Rj_emWJBE1QFbJ7klrb00yOwEIx3RPfFuJ0cOpfS_unqoP3Ic5A5gywomD-B1BrMj-apnz6taYheDOBrOK4uB2SDT-/s72-c/NastaliqOnline.ir.jpg" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-7815608552912766349</id><published>2014-07-10T16:19:00.000+02:00</published><updated>2014-07-10T16:19:08.580+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="اروپا"/><category scheme="http://www.blogger.com/atom/ns#" term="ترجمه ماشینی"/><category scheme="http://www.blogger.com/atom/ns#" term="حافظه‌ترجمه"/><category scheme="http://www.blogger.com/atom/ns#" term="پیکره"/><title type='text'>یک منبع عالی برای حافظه ترجمه </title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiOGNkaf8fncZ4DRXH-Cwgv-HrEJN3W1cjS1LgmiktXdGaUew3HgPMlp1XRSeIqzSMiXAhO8ETAVfz1K7VFB1eyOjQ_0WwPFEHilJ498mmAe2tpL7fiX2CwIqkuXQ_DeKWPUA1d/s1600/EuropeFlags.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiOGNkaf8fncZ4DRXH-Cwgv-HrEJN3W1cjS1LgmiktXdGaUew3HgPMlp1XRSeIqzSMiXAhO8ETAVfz1K7VFB1eyOjQ_0WwPFEHilJ498mmAe2tpL7fiX2CwIqkuXQ_DeKWPUA1d/s1600/EuropeFlags.jpg&quot; height=&quot;206&quot; width=&quot;320&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
یکی از منابع مهم برای تولید یک سیستم ترجمه ماشینی، داشتن پیکره‌های موازی است. به این معنی که در پیکره موازی جملات ترجمه شده بین دو زبان را داشته باشیم. با داشتن این پیکره . استفاده از ابزارهای آماده مانند موسی (&lt;a href=&quot;http://www.statmt.org/moses/&quot; target=&quot;_blank&quot;&gt;moses&lt;/a&gt;) می‌توان یک برنامه ترجمه ماشینی را به سرعت آماده کرد.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: justify;&quot;&gt;
در ادامه پروژه ترجمه ماشینی اتحادیه اروپا، جندی پیش مسئولان پروژه یکی از بزرگترین &amp;nbsp;پیکره‌های موازی را برای ۲۲ زیان و ۲۳۱ ترکیب زبانی منتشر کردند. این پیکره‌ها در درجه اول توسط مترجمان حرفه‌ای برای بالا بردن کیفیت و سرعت ترجمه استفاده شده است. اما در حال حاضر امکان استفاده از آنها برای آموزش یک سیستم ترجمه ماشینی برای همه افراد وجود دارد.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
-&amp;nbsp;&lt;a href=&quot;http://arxiv.org/pdf/1309.5226.pdf&quot; target=&quot;_blank&quot;&gt;درمورد این پیکره‌های حافظه ترجمه&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
-&amp;nbsp;&lt;a href=&quot;http://ipsc.jrc.ec.europa.eu/?id=61&quot; target=&quot;_blank&quot;&gt;دانلود پیکره اتحادیه اروپا&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
-&amp;nbsp;&lt;a href=&quot;http://www.euromatrix.net/&quot; target=&quot;_blank&quot;&gt;پروژه ترجمه ماشینی اتجادیه اروپا&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
- &lt;a href=&quot;http://www.statmt.org/&quot; target=&quot;_blank&quot;&gt;تمام ابزارها و منابع لازم برای ترجمه ماشینی&amp;nbsp;آماری&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/7815608552912766349/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/7815608552912766349?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/7815608552912766349'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/7815608552912766349'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/07/Euro-Corpus-Translation-Memory.html' title='یک منبع عالی برای حافظه ترجمه '/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiOGNkaf8fncZ4DRXH-Cwgv-HrEJN3W1cjS1LgmiktXdGaUew3HgPMlp1XRSeIqzSMiXAhO8ETAVfz1K7VFB1eyOjQ_0WwPFEHilJ498mmAe2tpL7fiX2CwIqkuXQ_DeKWPUA1d/s72-c/EuropeFlags.jpg" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-6055236964063023807</id><published>2014-07-09T16:51:00.002+02:00</published><updated>2014-08-06T09:44:18.225+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="زبان فارسی"/><category scheme="http://www.blogger.com/atom/ns#" term="نیم‌فاصله"/><title type='text'>بررسی وضعیت نیم‌فاصله در پیکره همشهری آنلاین</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj8Oc6E4BwHXD5rVZwhDJ_UF-weYCKpqiw4bHO5D49F6-gUzTA65SMyFU5sIcbxBJzrwn2VWtRDJW2kIZgNIwsXAwVbT9jyIg7qr6P9dc-4j5-jMhoVBRsY1IzQjarys5klkbC9/s1600/1349332461634_i.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj8Oc6E4BwHXD5rVZwhDJ_UF-weYCKpqiw4bHO5D49F6-gUzTA65SMyFU5sIcbxBJzrwn2VWtRDJW2kIZgNIwsXAwVbT9jyIg7qr6P9dc-4j5-jMhoVBRsY1IzQjarys5klkbC9/s1600/1349332461634_i.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در ادامه مطالب &lt;a href=&quot;http://blog.dilmaj.net/2014/07/farsi-zwnj.html&quot; target=&quot;_blank&quot;&gt;نوشته شده&lt;/a&gt; در زمینه &lt;a href=&quot;http://blog.dilmaj.net/2014/07/farsi-zwnj-farhangestan.html&quot; target=&quot;_blank&quot;&gt;نیم‌فاصله&lt;/a&gt;، این نوشته قصد دارد بخشی از اشتباهات موجود در یکی از پیکره‌های زبان فارسی را مطرح کند. اینروزها بجز از چند سایت خبری که از نرم‌افزارهای قدیمی برای ویراش اخبارشان استفاده می‌کنند، بیشتر سایتها از نیم‌فاصله تا حد امکان استفاده می‌کنند. اما کماکان در بعضی از موارد از فاصله بجای (به‌جای) نیم‌فاصله استفاده می‌کنند که می‌تواند باعث بروز مشکلاتی در پردازش محتوای آنها بشود.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در اینجا به چند مورد از بیشترین اشتباهات صورت گرفته در سایت&amp;nbsp;&lt;a href=&quot;http://www.hamshahrionline.ir/&quot; target=&quot;_blank&quot;&gt;روزنامه همشهری آنلاین&lt;/a&gt; اشاره می‌کنم. این لیست پس از بررسی پیکره همشهری آنلاین تهیه شده است. این پیکره در حدود ۱۱۲ میلیون کلمه (شامل۶۳۰ هزار واژه) دارد.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;br /&gt;
&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
بین المللی &amp;nbsp; --- بین‌المللی&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
گفت وگو --- گفت‌وگو&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
سرمایه گذاری &amp;nbsp; --- &amp;nbsp; سرمایه‌گذاری&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
روبه رو &amp;nbsp; --- &amp;nbsp; روبه‌رو&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
بین الملل &amp;nbsp; --- &amp;nbsp; بین‌الملل&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
تصمیم گیری &amp;nbsp; --- &amp;nbsp; تصمیم‌گیری&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
خصوصی سازی &amp;nbsp; --- خصوصی‌سازی&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
چشم انداز &amp;nbsp; --- &amp;nbsp; چسم‌انداز&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
آن قدر &amp;nbsp; --- &amp;nbsp; آن‌قدر&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
فوق العاده &amp;nbsp; --- &amp;nbsp; فوق‌العاده&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
روزنامه نگاری &amp;nbsp; --- &amp;nbsp; روزنامه‌نگاری&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
قلعه نویی &amp;nbsp; --- &amp;nbsp; قلعه‌نوعی&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
گفت وگوی &amp;nbsp; --- &amp;nbsp; گفت‌وگوی&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
برمی گردد &amp;nbsp; --- &amp;nbsp; برمی‌گردد&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
جابه جایی &amp;nbsp; --- &amp;nbsp; جابه‌جایی&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
جست وجو &amp;nbsp; --- &amp;nbsp; جست‌وجو&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
سهمیه بندی &amp;nbsp; --- سهمیه‌بندی&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
حزب الله &amp;nbsp; --- &amp;nbsp; حزب‌الله&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
گفت وگویی &amp;nbsp; --- &amp;nbsp; گفت‌وگویی&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
خانواده اش &amp;nbsp; --- &amp;nbsp; خانواده‌اش&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
صاحب نظران &amp;nbsp; --- &amp;nbsp; صاحب‌نظران&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
گفت وگوهای &amp;nbsp; --- &amp;nbsp; گفت‌وگوهای&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
فرهنگ سازی &amp;nbsp; --- &amp;nbsp; فرهنگ‌سازی&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
جابه جا &amp;nbsp; --- &amp;nbsp; جابه‌جا&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
گفت وگوها &amp;nbsp; --- &amp;nbsp; گفت‌وگوها&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
بیت المقدس &amp;nbsp; --- &amp;nbsp; بیت‌المقدس&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
زندگی اش &amp;nbsp; --- &amp;nbsp; زندگی‌اش&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
نتیجه گیری &amp;nbsp; --- &amp;nbsp; نتیجه‌گیری&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
بازمی گردد &amp;nbsp; --- &amp;nbsp; باز‌می‌گردد&lt;/div&gt;
&lt;div style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
برای تمام موارد اشاره شده ، کلمه در درست هم به کرات در متن استفاده شده است که در جلوی هر کلمه آورده شده.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اگر خواستار اطلاعات بیشتر درمورد پیکره همشهری آنلاین (متفاوت از پیکره همشهری بی‌جن‌خان) هستید، با من از طریق آدرس زیر تماس بگیرید.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: center;&quot;&gt;
&lt;a href=&quot;http://blog.dilmaj.net/p/blog-page_16.html&quot; target=&quot;_blank&quot;&gt;فرم تماس با من&lt;/a&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/6055236964063023807/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/6055236964063023807?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/6055236964063023807'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/6055236964063023807'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/07/hamshahri-online-corpus-zwnj-analysis.html' title='بررسی وضعیت نیم‌فاصله در پیکره همشهری آنلاین'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj8Oc6E4BwHXD5rVZwhDJ_UF-weYCKpqiw4bHO5D49F6-gUzTA65SMyFU5sIcbxBJzrwn2VWtRDJW2kIZgNIwsXAwVbT9jyIg7qr6P9dc-4j5-jMhoVBRsY1IzQjarys5klkbC9/s72-c/1349332461634_i.png" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-6350493975395119261</id><published>2014-07-04T17:03:00.000+02:00</published><updated>2014-07-09T16:54:46.104+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="زبان فارسی"/><category scheme="http://www.blogger.com/atom/ns#" term="فرهنگستان زبان فارسی"/><category scheme="http://www.blogger.com/atom/ns#" term="نیم‌فاصله"/><title type='text'>نگارش فارسی و نیم‌فاصله از دید فرهنگستان زبان و ادب فارسی</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEihSBaS7Nf20BSUZKNxM2s9D_-NbjJTmQFqAvba4mwAkii-5EYEhKfjKyGu_-1HAzxRAUXM6u1LR3rEvClD7TiSJsud56y98JGmfZcIxaXeea6OMBenAieyK0sN-Xzfx9lw-hrP/s1600/ARM.JPG&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEihSBaS7Nf20BSUZKNxM2s9D_-NbjJTmQFqAvba4mwAkii-5EYEhKfjKyGu_-1HAzxRAUXM6u1LR3rEvClD7TiSJsud56y98JGmfZcIxaXeea6OMBenAieyK0sN-Xzfx9lw-hrP/s1600/ARM.JPG&quot; height=&quot;204&quot; width=&quot;320&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
گاهی برای من مشخص نیست که آیا در مورد یک کلمه خاص باید از نیم‌فاصله استفاده کرد یا اینکه باید با فاصله نوشته بشه. در حالت سوم هم گاهی کلا هیچ نوع فاصله‌ای درکار نیست. مثلا جمله زیر را در نظر بگیرید:&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: center;&quot;&gt;
&lt;b&gt;&lt;span style=&quot;color: #cc0000;&quot;&gt;همچنان به فیزیوتراپی و آب درمانی مشغول است.&lt;/span&gt;&lt;/b&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
آیا کلمه آب درمانی (آب‌درمانی) باید بصورت یک کلمه واحد با نیم‌فاصله نوشته بشه یا اینکه باید بصورت جدا نوشته بشه. یا اینکه هر دو این حالتها درسته؟&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
موارد از این دست در متون فارسی زیاد هست که به بعضی از اونها در ادامه اشاره شده:&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
به‌جای &amp;nbsp;-- بجای --- به جای&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
هیچ کس &amp;nbsp;--&amp;nbsp;هیچ‌کس &amp;nbsp;--&amp;nbsp;هیچکس&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
فن آوری --&amp;nbsp;فن‌آوری --&amp;nbsp;فنآوری&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
به وجود ---&amp;nbsp;به‌وجود ---&amp;nbsp;بوجود&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
همین جا ---&amp;nbsp;همین‌جا ---&amp;nbsp;همینجا&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
شناخته شده ---&amp;nbsp;شناخته‌شده&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
کوچک تر ---&amp;nbsp;کوچک‌تر --&amp;nbsp;کوچکتر&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
البته برای بعضی از این موارد در &lt;a href=&quot;http://www.persianacademy.ir/fa/tarkibat.aspx&quot; target=&quot;_blank&quot;&gt;سایت فرهنگستان &amp;nbsp;زبان فارسی&lt;/a&gt; توضیحاتی آمده است. نکته جالب اینه که در همین متن نوشته شده در فرهنگستان هم &lt;a href=&quot;http://blog.dilmaj.net/2014/07/farsi-zwnj.html&quot; target=&quot;_blank&quot;&gt;مشکل نیم‌فاصله&lt;/a&gt; وجود داره. جائیکه در مورد کلمات ترکیبی که الزاما جدا نوشته میشوند، نوشته:&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;span style=&quot;background-color: #f4f4f4; font-family: Tahoma; font-size: x-small; line-height: 19.19999885559082px; text-align: justify;&quot;&gt;&amp;nbsp;&lt;/span&gt;&lt;strong style=&quot;background-color: #f4f4f4; font-family: Tahoma; font-size: small; line-height: 19.19999885559082px; text-align: justify;&quot;&gt;دست‌کم، شوراى عالى، حاصل ضرب، صرف ‌نظر، سیب‌زمینى، آب‌میوه، آب‌لیمو&lt;/strong&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;strong style=&quot;background-color: #f4f4f4; font-family: Tahoma; font-size: small; line-height: 19.19999885559082px; text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/strong&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
با کمی دقت میشه دید که برای کلمه حال‌ضرب از فاصله استفاده شده و نه نیم‌فاصله در حالیکه برای سیب‌زمینی از نیم‌فاصله استفاده شده است. وقتی در نوشته رسمی فرهنگستان چنین اشتباهی وجود داشته باشه، نمیشه از نویسندگان سایتهای خبری انتظار بیشتری داشت.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
نوشته‌های مرتبط:&lt;br /&gt;
- &lt;a href=&quot;http://blog.dilmaj.net/2014/07/hamshahri-online-corpus-zwnj-analysis.html&quot; target=&quot;_blank&quot;&gt;بررسی وضعیت نیم‌فاصله در پیکره همشهری آنلاین&lt;/a&gt;&lt;br /&gt;
- &lt;a href=&quot;http://blog.dilmaj.net/2014/07/farsi-zwnj.html&quot; target=&quot;_blank&quot;&gt;نیم‌فاصله یا فاصله مجازی در زبان فارسی&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/6350493975395119261/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/6350493975395119261?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/6350493975395119261'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/6350493975395119261'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/07/farsi-zwnj-farhangestan.html' title='نگارش فارسی و نیم‌فاصله از دید فرهنگستان زبان و ادب فارسی'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEihSBaS7Nf20BSUZKNxM2s9D_-NbjJTmQFqAvba4mwAkii-5EYEhKfjKyGu_-1HAzxRAUXM6u1LR3rEvClD7TiSJsud56y98JGmfZcIxaXeea6OMBenAieyK0sN-Xzfx9lw-hrP/s72-c/ARM.JPG" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-1893347885199531223</id><published>2014-07-04T12:29:00.000+02:00</published><updated>2014-08-06T09:47:28.455+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="زبان فارسی"/><category scheme="http://www.blogger.com/atom/ns#" term="نیم‌فاصله"/><title type='text'>نیم‌فاصله یا فاصله مجازی در زبان فارسی</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;table align=&quot;center&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;margin-left: auto; margin-right: auto; text-align: center;&quot;&gt;&lt;tbody&gt;
&lt;tr&gt;&lt;td style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEidGzQfaRjSb4Y1sWnFLDz-5RCn1o5gkqBFdw96WPyReQOB-PVSCGoCbdqWmS_j_q-AxuOVC3phyphenhyphentI2dR0eCEv_xK897jHnH2jomFUl5PzTCXmj2_HYIJDCtebydEsZZrZzDi08/s1600/NastaliqOnline.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: auto; margin-right: auto;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEidGzQfaRjSb4Y1sWnFLDz-5RCn1o5gkqBFdw96WPyReQOB-PVSCGoCbdqWmS_j_q-AxuOVC3phyphenhyphentI2dR0eCEv_xK897jHnH2jomFUl5PzTCXmj2_HYIJDCtebydEsZZrZzDi08/s1600/NastaliqOnline.png&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;text-align: center;&quot;&gt;فارسی شکر است&lt;/td&gt;&lt;/tr&gt;
&lt;/tbody&gt;&lt;/table&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اینروزها یکی از کارهای من اینه که بر روی نرمال سازی پیکره‌های فارسی کار کنم. بزرگترین مشکلی که دیده‌ام در مورد استفاده از &lt;a href=&quot;http://fa.wikipedia.org/wiki/%D9%81%D8%A7%D8%B5%D9%84%D9%87_%D9%85%D8%AC%D8%A7%D8%B2%DB%8C&quot; target=&quot;_blank&quot;&gt;نیم‌فاصله&lt;/a&gt;&amp;nbsp;یا فاصله مجازی بوده. نمی‌دانم چرا یک سایتهای خبری یک قانون مشخص در این‌مورد ندارن که مثلا اینکه یک سایت اصلا از نیم‌فاصله استفاده نکنه. وقتی قانون مشخصی نداریم، اینطوری میشه که در یک سایت تمام حالتهای مختلف استفاده و عدم استفاده نیم‌فاصله برای یک کلمه خاص وجود داره.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در بیشتر موارد این اسامی جمع یا صرف فعل هست که این مشکل را داره.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
می توانم ---&amp;gt; می‌توانم&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
کتاب ها ----&amp;gt; کتاب‌ها &amp;nbsp; یا کتابها&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اما گاهی پیچیدگی بیشتر هست. مثلا در مورد اسم شهرهایی که ترکیبی هستند مثل &lt;a href=&quot;http://fa.wikipedia.org/wiki/%D8%AE%D9%85%DB%8C%D9%86%DB%8C%E2%80%8C%D8%B4%D9%87%D8%B1&quot; target=&quot;_blank&quot;&gt;خمینی‌شهر&lt;/a&gt;.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
جملات زیر را در نظر بگیرید:&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در میدان امام خمینی شهر لواسان&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در میدان امام &lt;a href=&quot;http://fa.wikipedia.org/wiki/%D8%AE%D9%85%DB%8C%D9%86%DB%8C%E2%80%8C%D8%B4%D9%87%D8%B1&quot; target=&quot;_blank&quot;&gt;خمینی شهر&lt;/a&gt; اصفهان&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در شهرستان خمینی‌شهر اصفهان&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در میدان امام خمینی شهر &lt;a href=&quot;http://fa.wikipedia.org/wiki/%D8%AE%D9%85%DB%8C%D9%86%DB%8C%E2%80%8C%D8%B4%D9%87%D8%B1&quot; target=&quot;_blank&quot;&gt;خمینی‌شهر&lt;/a&gt; اصفهان&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در تمام موارد بالا، تنها نویسنده مطلب هست که می‌تونه با درست نوشتن کمک کنه که ابهام از بین بره. جالبه که ذهن انسان می‌تونه این ابهام را براحتی حل کنه اما در حال حاضر الگورتیمی برای حل اون توسط کامپیوتر نداریم (یا حداقل من خبر ندارم و پیدا نکردم).&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
حالا در نظر بگیرید که در یک سایت خبری موارد زیر را دیده‌ام:&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
- به نمایندگی ایران خودرو در خمینی شهر تحویل داد&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
- در آن مثال شهرستان خمینی شهر زده شد&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
- علیرضا باقری از خمینی‌شهر&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
- تحت پوشش کمیته امداد امام خمینی شهر تهران&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
- سر رسید مفاخر خمینی‌شهر را تهیه کرده بود&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
- مردم خمینی‌شهر مردم شعر شناسی هستند&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
- پس از انقلاب به خمینی شهر تغییر یافت&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
هر دو حالت استفاده از نیم‌فاصله و بدون نیم فاصله در سایت وجود داره. حالا اگه بخواهید هر نوع پردازش متنی برروی محتوای این سایت انجام بدین، به مشکل برخورد می‌کنین. حتی یک جستجوی ساده برای اسم شهر خمینی‌شهر می‌تونه تعداد زیادی از نتایج را نشان نده. البته روشهایی هست که بتونه نتایج را بهتر کنه اما سوال من اینه که آیا بهتر نیست که سایتهای خبری در مورد استفاده یا عدم استفاده از نیم‌فاصله رویه ثابتی داشته باشند؟&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/1893347885199531223/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/1893347885199531223?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/1893347885199531223'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/1893347885199531223'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2014/07/farsi-zwnj.html' title='نیم‌فاصله یا فاصله مجازی در زبان فارسی'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEidGzQfaRjSb4Y1sWnFLDz-5RCn1o5gkqBFdw96WPyReQOB-PVSCGoCbdqWmS_j_q-AxuOVC3phyphenhyphentI2dR0eCEv_xK897jHnH2jomFUl5PzTCXmj2_HYIJDCtebydEsZZrZzDi08/s72-c/NastaliqOnline.png" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-4797345039178628963</id><published>2013-07-13T16:49:00.001+02:00</published><updated>2013-07-13T16:49:34.388+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="دادگان"/><category scheme="http://www.blogger.com/atom/ns#" term="پردازش زبان طبیعی"/><category scheme="http://www.blogger.com/atom/ns#" term="پیکره"/><title type='text'>دادگان - مرجعی برای تمام داده های زبان فارسی</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;http://www.dadegan.ir/themes/corolla/logo.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;http://www.dadegan.ir/themes/corolla/logo.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;a href=&quot;http://www.dadegan.ir/about&quot; target=&quot;_blank&quot;&gt;گروه پژوهشی دادگان&lt;/a&gt; در &lt;a href=&quot;http://www.scict.ir/Portal/Home/&quot; target=&quot;_blank&quot;&gt;دبیرخانه شورای عالی اطلاع رسانی&lt;/a&gt; وب سایتی را برای معرفی تمام داده های موجود زبان فارسی ارائه کرده است. خوبی اینکار این هست که افراد و شرکتهای فعال در زمینه پردازش زبان فارسی می توانند بصورت متمرکز به این اطلاعات دسترسی داشته باشند. اضافه بر اینکه در هر مورد شما می توانید براحتی اطلاعاتی در مورد تولید کننده داده و نحوه تماس با آنها پیدا کنید.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;b&gt;اما چند نکته:&lt;/b&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
- بیشتر دادگانی که با پشتیبانی دبیرخانه شورای عالی اطلاع رسانی در مراکز پژوهشی انجام شده، فقط قابل استفاده توسط دانشگاههای ایرانی است. ظاهرا در این میان راه حلی برای استفاده تحقیقاتی از این اطلاعات در شرکتهای داخلی یا خارجی در نظر گرفته نشده است.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
- در چند مورد من تلاش کردم که اطلاعات بیشتری در مورد داده ها و اینکه چطور می توانم از آنها برای کارهای تحقیقاتی در شرکت استفاده کنم بدست بیاورم که متاسفانه کسی پاسخگو نبود. البته بدیهی بود که وظیفه پاسخگوئی بر عهده دبیرخانه نیست و برای هر داده باید با تولید کننده آن تماس گرفت. اما متاسفانه چند تولید کننده ای که من برای آنها فرمهای خواسته شده را فرستادم و حتی با ایمیل هم پیگیری کردم، جوابی به من ندادند.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
با توجه به اینکه تقریبا در تمام مواردی که ایمیل فرستادم، کسی جوابی به من نداد، تصور میکنم این اطلاعات در حقیقت بخشی از قرارداد دبیرخانه برای پشتیبانی مالی پروژه های معرفی شده بوده و مهم نیست که آیا کسی امکان دسترسی به این داده ها را دارد یا نه.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;
</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/4797345039178628963/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/4797345039178628963?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/4797345039178628963'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/4797345039178628963'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2013/07/blog-post.html' title='دادگان - مرجعی برای تمام داده های زبان فارسی'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-9018644677841569480</id><published>2012-05-28T16:41:00.000+02:00</published><updated>2012-05-28T16:44:33.610+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="ایران"/><category scheme="http://www.blogger.com/atom/ns#" term="زبان فارسی"/><category scheme="http://www.blogger.com/atom/ns#" term="پردازش زبان طبیعی"/><category scheme="http://www.blogger.com/atom/ns#" term="کنفرانس"/><title type='text'>اولین کنفرانس بین المللی پردازش زبان طبیعی فارسی</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اینروزها با گسترش اینترنت بین فارسی زبانان در سراسر دنیا؛ استفاده از ابزارهای پردازش زبان فارسی اهمیت بیشتری پیدا کرده اند. بطوریکه بالاخره بعد از مدتها خبر برگزاری یک کنفرانس بین المللی در زمینه پردازش زبان فارسی به علاقه مندان این رشته نشان داد که این اهمیت در داخل ایران هم دیده شده است.&amp;nbsp;امسال &lt;a href=&quot;http://icplp2012.semnan.ac.ir/indexF.php&quot; target=&quot;_blank&quot;&gt;اولین کنفرانس بین المللی پردازش زبان فارسی&lt;/a&gt; در دانشگاه سمنان برگزار میشه. این کنفرانس در روزهای 15-16 شهریور 1391 برگزار خواهد شد. امیدوارم که اینکار ادامه پیدا کرده و در نهایت بعد از مدتها یک کنفرانس تخصصی پردازش زبان طبیعی برای زبان فارسی در ایران داشته باشیم. کنفرانسی که کمک خواهد کرد که محققان و دانشجویان و شرکتهای فعال در این زمینه با هم آشنا شده و بتوانند در آینده پروژه های بهتری را در این زمینه تعریف کنند.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در صورت برگزاری این کنفرانس در دوره های بعدی می توان امیدوار بود که تحقیقات دانشگاهی در زمینه پردازش زبان طبیعی در داخل ایران به تولید محصولات بهتری در این زمینه کمک کند.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
مطالب مرتبط :&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;ul dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;li&gt;&lt;a href=&quot;http://blog.dilmaj.net/2004/05/blog-post_30.html&quot; target=&quot;_blank&quot;&gt;در مورد اولین کارگاه پژوهشی زبان فارسی&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;http://www.scict.ir/Portal/Home/Default.aspx?CategoryID=1124824e-4937-4a12-bb6f-b9d6dd01eb38&quot; target=&quot;_blank&quot;&gt;کارگروه خط و زبان فارسی در محیط رایانه - شورای عالی اطلاع رسانی&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&quot;http://blog.dilmaj.net/2005/05/blog-post.html&quot; target=&quot;_blank&quot;&gt;اولین همایش بومی سازی در حوزه خط و زبان فارسی&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/9018644677841569480/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/9018644677841569480?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/9018644677841569480'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/9018644677841569480'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2012/05/blog-post_28.html' title='اولین کنفرانس بین المللی پردازش زبان طبیعی فارسی'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-8164504833637343113</id><published>2012-05-04T12:25:00.001+02:00</published><updated>2012-05-04T16:14:29.214+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="معرفی سرویس"/><category scheme="http://www.blogger.com/atom/ns#" term="کامپیوتر"/><title type='text'>چطور می توانید فایلهای خودتان را با دوستانتان به اشتراک بگذارید؟</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
حتما برای شما هم پیش آمده است که خواسته باشید فایلی را برای دوستتان بفرستید اما بدلیل محدودیت پیوست کردن فایل به ایمیل نتوانسته اید آنرا بفرستید. یا اینکه خواسته باشید یک فایل را برای تعداد زیادی از دوستانتان بفرستید و مجبور نباشید که برای هرکدام یک کپی از فایل را بفرستید.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اگر مشابه چنین مشکلی داشته اید، این نوشته می تواند به شما کمک کند که از امکانات جدید (و رایگان) اشتراک فایل در اینترنت برای اینکار استفاده کنید.&lt;br /&gt;
&lt;br /&gt;
&lt;div style=&quot;text-align: center;&quot;&gt;
&lt;span class=&quot;Apple-style-span&quot; style=&quot;color: blue;&quot;&gt;شما می توانید ۵۰ گیگا بایت فضای مجانی اما کمی کند از &lt;a href=&quot;http://www.box.net/&quot; target=&quot;_blank&quot;&gt;باکس&lt;/a&gt; بگیرید، یا اینکه ۲ گیگا بایت مجانی ولی پرسرعت از &lt;a href=&quot;http://db.tt/G46w4SWo&quot; target=&quot;_blank&quot;&gt;دراپ باکس&lt;/a&gt; بگیرید. توضیحات بیشتر در ادامه این مطلب نوشته شده است.&lt;/span&gt;&lt;/div&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;br /&gt;
&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
یک راه اشتراک فایل این است که شما فایل خودتان را در جائی در اینترنت قرار دهید (آپلود کنید) &amp;nbsp;و بعد لینک آنرا به دوستانتان بدهید تا بتوانند آنرا ببینند. در ضمن شما می خواهید کنترل کنید که چه کسانی بتوانند فایل شما را دانلود کنند یا عکس شما را ببینند. در حال حاضر سرویسهای متنوعی برای اینکار بصورت رایگان ارائه شده اند در ادامه آنها را توضیح داده و مزایا و معیب هر کدام را بررسی میکنیم.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
۱- &lt;a href=&quot;http://db.tt/G46w4SWo&quot; target=&quot;_blank&quot;&gt;دراپ باکس&lt;/a&gt;&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjXFlfkj65nN-wgBHx8YzNr1XMvaYTlWSZF2zvfxY4BJCi_YeYSFxsj-b2wr3VWji3vPRhni4CLnkhBuT0vZ3x4gWa2YuETFfiV7DDb7y6pum4iVKNpaVZQbx2yoP5QTt1gTimW/s1600/dropbox.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjXFlfkj65nN-wgBHx8YzNr1XMvaYTlWSZF2zvfxY4BJCi_YeYSFxsj-b2wr3VWji3vPRhni4CLnkhBuT0vZ3x4gWa2YuETFfiV7DDb7y6pum4iVKNpaVZQbx2yoP5QTt1gTimW/s1600/dropbox.jpg&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
یکی از بهترین سرویسهای اشتراک فایل هست که استفاده از آن تا ۲ گیگابایت مجانی است. در صورتیکه برنامه آنرا بر روی کامپیوتر خودتان نصب کنید، اشتراک گذاشتن یک فایل از روی کامپیوترتان به سادگی کپی کردن فایل در یک کامپیوتر شما است. فراموش نکنید که برای استفاده از تمام امکانات این سرویس بهتر است که برنامه معرفی شده در سایت را هم نصب کنید.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
این برنامه برای ویندوز و لینوکس و همچنین اندروید و ای آو اس (موبایل) ارائه شده است که بعد از نصب یک فولدر با نام دراپ باکس در کامپیوتر شما درست میکند. شما براحتی می توانید فایلهای خودتان را در این فولدر کپی کنید و آنرا با دوستان خودتان به اشتراک بگذارید. تمام کارهای مربوط به آماده سازی نسخه اینترنتی فایل شما بر عهده برنامه نصب شده خواهد بود. شما نیازی ندارید که هربار در سایت دراپ باکس وارد شده و فایل را آنجا آپلود کنید.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
در ضمن در صورتیکه این برنامه را به دوستان خودتان معرفی کنید، برای هر نفر که برنامه آنرا نصب کند به شما ۲۵۰ مگابایت فضای رایگان می دهد.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
۲- &lt;a href=&quot;http://drive.google.com/&quot; target=&quot;_blank&quot;&gt;گوگل درایو&lt;/a&gt;&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgOEMFE0ykukrjYoCWN3WFFrunu15GoE7V6Ofi-cxwze-lNnTCiBGlEKalLmoKO7sP9_esaYZfaboZ2sA8SzL3iNdm0JO7VDB3WYQw6qpbBX_riVFAC71uUCHaz9rSbJxAiIWYm/s1600/googledrive.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;200&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgOEMFE0ykukrjYoCWN3WFFrunu15GoE7V6Ofi-cxwze-lNnTCiBGlEKalLmoKO7sP9_esaYZfaboZ2sA8SzL3iNdm0JO7VDB3WYQw6qpbBX_riVFAC71uUCHaz9rSbJxAiIWYm/s200/googledrive.jpg&quot; width=&quot;173&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
گوگل از مدتها قبل در بازار ارائه فضای رایگان جهت اشتراک فایل در اینترنت حضور داشت. در این سرویس هم شما می توانید برنامه ارائه شده را نصب کرده و از فولدری که گوگل بر ای شما در کامپیوتر ایجاد کرده برای اشتراک فایل استفاده کنید. اینبار هم تمام کارهای مربوط به اشتراک فایل در اینترنت از طریق برنامه انجام خواهد شد. این برنامه برای موبایل اندروید هم ارائه شده است.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
تفاوت این سرویس با دراپ باکس این است که در ابتدای کار گوگل فضای بیشتری را در اختیار شما قرار می دهد این فضا در حدود ۵ گیگا بایت است که فابل ارتقاء است (با پرداخت کمی هزینه)&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
۳- &lt;a href=&quot;http://skydrive.live.com/&quot; target=&quot;_blank&quot;&gt;اسکای درایو&lt;/a&gt; (میکروسافت)&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh2ZRPXVDDoxzWF7aKxF3mRbPcRabFGJ_-hKlbbaUK8aykpAhYWT-eN3RW-aLUh9EUP35jib6eRDqULD35jsBEWn8UpKPw6YJWilZyeMVTBWKsdXbKqgqwkpYzzDezIy_L0c8Eu/s1600/logo_msSkyDrive_web.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;55&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh2ZRPXVDDoxzWF7aKxF3mRbPcRabFGJ_-hKlbbaUK8aykpAhYWT-eN3RW-aLUh9EUP35jib6eRDqULD35jsBEWn8UpKPw6YJWilZyeMVTBWKsdXbKqgqwkpYzzDezIy_L0c8Eu/s200/logo_msSkyDrive_web.jpg&quot; width=&quot;200&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
شرکت میکروسافت هم از مدتها قبل سرویس مربوط به فضای رایگان در اینترنت را با نام اسکای درایو ارائه کرده است. این سرویس در ابتدا حدود ۱ گیگا بایت بود. بعدا تا ۲۵ گیگا بایت (درست خواندید ۲۵ گیگا بایت) فضا افزایش یافت. در حال حاضر این سرویس برای کاربران قدیمی همان ۲۵ گیگا بایت هست اما برای افرادی که اکانت جدید درست کنند حدود ۷ گیگا بایت خواهد بود.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
متاسفانه این سرویس برنامه ای برای موبایلهای اندروید تابحال ارائه نکرده است و برنامه ارائه شده تنها امکان نصب بر روی گوشیهای ویندوزی و آف فون را دارد.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
۴- &lt;a href=&quot;http://www.zumodrive.com/&quot; target=&quot;_blank&quot;&gt;زومو درایو&lt;/a&gt; (یاهو)&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjtOYE00kKjHRDs5UvpbfEaaygV0BYGLat27eRAu_IybAP9QoVXGyZHDLu6HW0bxG1LSxGoK3PEu42EH_ZP4O07Ow24a0nuWNuzlOwIAkcjM2MprTkI50afkokdfbloBiAhHLny/s1600/zumo-1.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;200&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjtOYE00kKjHRDs5UvpbfEaaygV0BYGLat27eRAu_IybAP9QoVXGyZHDLu6HW0bxG1LSxGoK3PEu42EH_ZP4O07Ow24a0nuWNuzlOwIAkcjM2MprTkI50afkokdfbloBiAhHLny/s200/zumo-1.png&quot; width=&quot;200&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
شرکت یاهو هم سرویس مشابهی را از طریق سایت زومو دروایو ارائه کرده است که حدود ۱/۵ گیگا بایت فضای مجانی در اختیار شما قرار می دهند. مانند بقیه سرویسهای معرفی شده، این سرویس هم برنامه ای در اختیار شما قرار می دهند که امکان اشتراک فایل را مستقیما از طریق کامپیوتر خودتان بدون نیاز به وارد شدن به سایت اینترنتی فراهم میکند.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
۵- &lt;a href=&quot;http://www.box.net/&quot; target=&quot;_blank&quot;&gt;باکس&lt;/a&gt;&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj1XOpvNnYYfbvi70vegLtZ15yhb3zg_nuQrOACwj-612F2reRfpwnVy7Ao54lGN5jDwWuLmpzbg08B6usU6Ma4qt_8Z7W0ppKZsL2RNIllGwW54ZxcXLITsqqK-u6apOR__-Ma/s1600/box_logo.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;200&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj1XOpvNnYYfbvi70vegLtZ15yhb3zg_nuQrOACwj-612F2reRfpwnVy7Ao54lGN5jDwWuLmpzbg08B6usU6Ma4qt_8Z7W0ppKZsL2RNIllGwW54ZxcXLITsqqK-u6apOR__-Ma/s200/box_logo.png&quot; width=&quot;200&quot; /&gt;&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
این سرویس بیشترین فضای مجانی را در مقایسه با بقیه سرویسها در اختیار شما قرار می دهد. در صورتیکه برنامه موبایل آنرا نصب کنید حدود ۵۰ گیگا بایت فضا در اختیار شما قرار می دهد. اما اشکال این سرویس این است که برای نصب برنامه آن در کامپیوتر خودتان باید پول بدهید. بعبارت دیگه این سرویس برای گرفتن فضای زیاد خوبه اما کار کردن با آن بسادگی بقیه سرویسها نیست.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;b&gt;در نهایت :‌&lt;/b&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
از بین سرویسهای ارائه شده بالا، در حال حاضر سرویس &lt;a href=&quot;http://db.tt/G46w4SWo&quot; target=&quot;_blank&quot;&gt;دراپ باکس &lt;/a&gt;سریعترین سرویس را ارائه می کند. بعلاوه اینکه شما براحتی می توانید حجم فضای خودتان را بصورت رایگان، از طریق معرفی آن به دوستان دیگر، اضافه کنید.&lt;/div&gt;
&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/8164504833637343113/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/8164504833637343113?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/8164504833637343113'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/8164504833637343113'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2012/05/blog-post.html' title='چطور می توانید فایلهای خودتان را با دوستانتان به اشتراک بگذارید؟'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjXFlfkj65nN-wgBHx8YzNr1XMvaYTlWSZF2zvfxY4BJCi_YeYSFxsj-b2wr3VWji3vPRhni4CLnkhBuT0vZ3x4gWa2YuETFfiV7DDb7y6pum4iVKNpaVZQbx2yoP5QTt1gTimW/s72-c/dropbox.jpg" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-5819182181425699030</id><published>2012-04-19T11:47:00.003+02:00</published><updated>2012-04-22T12:22:12.011+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="ترجمه کاربردی"/><category scheme="http://www.blogger.com/atom/ns#" term="فیلم"/><category scheme="http://www.blogger.com/atom/ns#" term="مترجم گوگل"/><title type='text'>استفاده کاربردی از ترجمه ماشینی گوگل</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
این نوشته در مورد نتایج خنده دار مترجم گوگل است که تقریبا در مورد همه مترجمهای ماشینی در همه زبانها صادق است.&lt;br /&gt;
&lt;br /&gt;
چندی قبل یکی از فارسی زبانان طنز پرداز اینترنتی (&lt;a href=&quot;http://www.youtube.com/user/alireza24tv&quot; target=&quot;_blank&quot;&gt;علیرضا۲۴&lt;/a&gt;)(&lt;a href=&quot;https://www.facebook.com/Alireza24&quot; target=&quot;_blank&quot;&gt;فیس بوک علیرضا۲۴&lt;/a&gt;) فیلمی را در مورد استفاده کاربردی ترجمه ماشنی گوگل در یوتیوب منتشر کرد. این فیلم به اینصورت است که فرد یک سناریوی فرضی را به زبان فارسی نوشته و اجرا میکند. بعد ترجمه انگلیسی آنرا هم به همان صورت قبلی اجرا میکند. در نهایت متن ترجمه شده انگلیسی را دوباره با &lt;a href=&quot;http://translate.google.com/&quot; target=&quot;_blank&quot;&gt;مترجم گوگل&lt;/a&gt; به فارسی ترجمه می کند. این متن آخر را دوباره در همان حالت قبلی اجرا میکند که بسیار جالب و خنده دادر درآمده. تصور نمیکنم کسی بتواند این فیلم را ببیند و بتواند جلوی خنده خودش را بگیرد.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;a href=&quot;http://dl.dropbox.com/u/68757022/google-translation.mp4&quot; target=&quot;_blank&quot;&gt;لینک اول برای دیدن یا دانلود&lt;/a&gt;&lt;br /&gt;
&lt;table align=&quot;center&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;margin-left: auto; margin-right: auto; text-align: center;&quot;&gt;&lt;tbody&gt;
&lt;tr&gt;&lt;td&gt;&lt;a href=&quot;http://dl.dropbox.com/u/68757022/google-translation.mp4&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: auto; margin-right: auto;&quot; target=&quot;_blank&quot;&gt;&lt;img alt=&quot;نتایج خنده دار مترجم گوگل&quot; border=&quot;0&quot; height=&quot;242&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjZcyF56vziTYmbqpb_UwrsXSNQLTZ8s_056cKWp8gVPlYy0YcRCvSKhXqNAW4ydOwLW8-ni1spEIHwd24Qx122V7cloMSyPdgG5rZ_XqFzHKzaMOHd8RPIU0r0UQxFS6iOF28k/s400/google-translate.png&quot; title=&quot;نتایج خنده دار مترجم گوگل&quot; width=&quot;400&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;font-size: 13px;&quot;&gt;نتایج خنده دار مترجم گوگل&lt;/td&gt;&lt;/tr&gt;
&lt;/tbody&gt;&lt;/table&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;nbsp;نسخه یوتیوب این فیلم را در زیر می توانید می بینید.&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div align=&quot;center&quot;&gt;
&lt;iframe allowfullscreen=&quot;&quot; frameborder=&quot;0&quot; height=&quot;315&quot; src=&quot;http://www.youtube.com/embed/n0y5NCVc8fY&quot; width=&quot;560&quot;&gt;&lt;/iframe&gt;
&lt;/div&gt;
&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;
&lt;br /&gt;
توضیح اینکه اصولا ترجمه رفت و برگشت در یک سیستم ترجمه ماشینی برای بیشتر زبانها می تونه متن اولیه را کلا عوض کنه. دلیل آنهم اینه که مدل استفاده شده برای تولید یک مترجم مثلا انگلیسی به فارسی و برعکس یک سرویس متقارن نیست. برای همین ترجمه رفت و برگشت می تونه متفاوت باشه.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/5819182181425699030/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/5819182181425699030?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/5819182181425699030'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/5819182181425699030'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2012/04/blog-post_19.html' title='استفاده کاربردی از ترجمه ماشینی گوگل'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjZcyF56vziTYmbqpb_UwrsXSNQLTZ8s_056cKWp8gVPlYy0YcRCvSKhXqNAW4ydOwLW8-ni1spEIHwd24Qx122V7cloMSyPdgG5rZ_XqFzHKzaMOHd8RPIU0r0UQxFS6iOF28k/s72-c/google-translate.png" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-295051327336630847</id><published>2012-04-04T13:38:00.002+02:00</published><updated>2012-04-04T13:38:24.040+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="کلاس درس"/><title type='text'>درس آنلاین پردازش زبان طبیعی</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
مدتیست که درس پردازش زبان طبیعی بصورت آنلاین و مجانی توسط دو تن از بزرگترین اساتید این&amp;nbsp;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
رشته در اینترنت ارائه شده است. استفاده از کلاس درس این دو استاد فرصت مناسبی است که همه دانسته های خودمان در این زمینه را مرورو کرده و آنها را با آخرین تحولات این رشته بروز رسانی کنیم.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
برای شرکت در این کلاسها از آدرس زیر استفاده کنید :‌&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;a href=&quot;https://class.coursera.org/nlp/auth/welcome&quot; target=&quot;_blank&quot;&gt;کلاس درس پردازش زبان طبیعی دانشگاه استنفورد&lt;/a&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;table align=&quot;center&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;margin-left: auto; margin-right: auto; text-align: center;&quot;&gt;&lt;tbody&gt;
&lt;tr&gt;&lt;td style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;http://spark-public.s3.amazonaws.com/nlp/landing/jurafsky.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: auto; margin-right: auto;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;http://spark-public.s3.amazonaws.com/nlp/landing/jurafsky.png&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;http://www.stanford.edu/~jurafsky/&quot; style=&quot;background-color: white; border-bottom-width: 0px; border-color: initial; border-left-width: 0px; border-right-width: 0px; border-style: initial; border-top-width: 0px; color: #0069d6; font-family: Verdana; font-size: 14px; line-height: 21px; margin-bottom: 0px; margin-left: 0px; margin-right: 0px; margin-top: 0px; padding-bottom: 0px; padding-left: 0px; padding-right: 0px; padding-top: 0px; text-align: justify; text-decoration: none;&quot; target=&quot;_blank&quot;&gt;Dan Jurafsky&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/tbody&gt;&lt;/table&gt;
&lt;table align=&quot;center&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;margin-left: auto; margin-right: auto; text-align: center;&quot;&gt;&lt;tbody&gt;
&lt;tr&gt;&lt;td style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;http://spark-public.s3.amazonaws.com/nlp/landing/manning.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: auto; margin-right: auto;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;http://spark-public.s3.amazonaws.com/nlp/landing/manning.png&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;http://nlp.stanford.edu/~manning/&quot; style=&quot;background-color: white; border-bottom-width: 0px; border-color: initial; border-left-width: 0px; border-right-width: 0px; border-style: initial; border-top-width: 0px; color: #00438a; font-family: Verdana; font-size: 14px; line-height: 21px; margin-bottom: 0px; margin-left: 0px; margin-right: 0px; margin-top: 0px; outline-color: initial; outline-style: initial; outline-width: 0px; padding-bottom: 0px; padding-left: 0px; padding-right: 0px; padding-top: 0px; text-align: justify;&quot; target=&quot;_blank&quot;&gt;Christopher Manning&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/tbody&gt;&lt;/table&gt;
&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/295051327336630847/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/295051327336630847?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/295051327336630847'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/295051327336630847'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2012/04/blog-post_04.html' title='درس آنلاین پردازش زبان طبیعی'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-510381896606739</id><published>2012-04-04T11:32:00.001+02:00</published><updated>2012-04-04T11:32:39.788+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="داده کاوی"/><category scheme="http://www.blogger.com/atom/ns#" term="کاربرد پردازش زبان طبیعی"/><title type='text'>چه موضوعی در زمینه پردازش زبان طبیعی توی بورس هست؟</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
اگر می خواهید در بازار کار همیشه طرفدار داشته باشید، یکی از سوالاتی که همیشه باید از خودتان بپرسید اینه که چه زمینه هائی از پردازش زبان طبیعی الان پرطرفدار هستند. از این پست قصد دارم در مورد هر کدام از مواردی که در زمینه پردازش زبان طبیعی الان پرطرفدار هستند کمی بنویسم.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
این نوشته بیشتر در مورد کاربردهای داده کاوی خواهد بود.&lt;/div&gt;
&lt;table align=&quot;center&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;margin-left: auto; margin-right: auto; text-align: center;&quot;&gt;&lt;tbody&gt;
&lt;tr&gt;&lt;td style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjLLwUUVQZoBhSqNnXZ-_nTRYGw8lglGvXpdWNJHdJY5Wcr2snEkfkU9jkw5xYAvYMb_ZeP8aUbhOQRjb5oSyhTYIdjOwaSi-m5-kFF6AQF-0FyYo3o671AQhHZbemNKBOl89sW/s1600/dm_process.gif&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: auto; margin-right: auto;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;197&quot; src=&quot;https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjLLwUUVQZoBhSqNnXZ-_nTRYGw8lglGvXpdWNJHdJY5Wcr2snEkfkU9jkw5xYAvYMb_ZeP8aUbhOQRjb5oSyhTYIdjOwaSi-m5-kFF6AQF-0FyYo3o671AQhHZbemNKBOl89sW/s320/dm_process.gif&quot; width=&quot;320&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;text-align: center;&quot;&gt;مراحل انجام داده کاوی&lt;/td&gt;&lt;/tr&gt;
&lt;/tbody&gt;&lt;/table&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
بسیار عالی خواهد بود اگر نظر خودتان را در مورد این دسته از نوشته ها در انتهای همین نوشته یا از طریق صفحه تماس با من خبر بدهید.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;/div&gt;
&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;b&gt;Social Network Data Mining&lt;/b&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
از پر طرفدارترین موضوع که پردازش متون شبکه های اجتماعی است شروع میکنم. در حال شرکتهای زیاید علاقه دارند که بتوانند اطلاعاتی را از شبکه های احتماعی استخراج کنند. اسم علمی اینکار داده کاوی (Data mining) به زبان فارسی است. یکی از اطلاعاتی که می توان استخراج کرد در مورد مطالبی است که هر کاربر می نویسد. مثلا اداره پلیس شهر علاقه مند است که بداند چه افرادی در مورد اتفاقاتی که در شهر افتاده یا خواهد افتاد صحبت کرده اند. به این ترتیب می توانند با این داده ها از بروز اتفاقات بعدی جلوگیری کنند (چیزی شبیه داستان گزارش اقلیت تام کروز). در حال حاضر بطور خاض شرکتهایی هستند که مستقیما برای اداره پلیس کار میکنند و هدف آنها جمع آوری اطلاعات در زمینه های جرم و جنایت هست.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;b&gt;Opinion Mining&amp;nbsp;&lt;/b&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
یکی دیگر از کاربردهای پردازش متون در شبکه های اجتماعی این است که یک شرکت مثلا بی ام و بداند که مردم در مورد آخرین مدل ماشین آنها چه نظری دارند. یا اینکه مثلا اگر آگهی را بصورت عمومی نمایش داده اند که ویژگیهای مدل جدید ماشنینی را نشان می دهد، نظر مردم چیست. این می تواند به آنها کمک کند که بازاریابی بهتری داشته باشند. گاهی مواردی از نظر مشتریان اهمیت دارد که شاید در اولین نگاه از دید بخش بازاریابی شرکت پنهان بوده باشد. مشابه همینکار می تواند برای نامزدهای انتخابات در کشورهای مختلف استفاده شود. اگر یک کاندید بتواند سریعتر از بقیه بفهمد که مردم در مورد آخرین صحبتهای او چه نظری دارند، می تواند در صورت لزوم سری آنها را تصحیح کند یا اینکه موارد قوت را بیشتر در صحبتهای بعدی مطرح کند. بصورت کلی مواردی مشابه اینرا در گروه پروژه های Opinion mining دسته بندی می کنند. ترجمه فارسی مناسبی برای این واژه سراغ ندارم اما شاید عبارت نظر کاوی درست باشد.&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
&lt;br /&gt;&lt;/div&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;
برای طولانی نشدن مطلب بقیه موارد را در یک نوشته دیگر برای شما خواهم نوشت.&lt;/div&gt;
&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/510381896606739/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/510381896606739?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/510381896606739'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/510381896606739'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2012/04/blog-post.html' title='چه موضوعی در زمینه پردازش زبان طبیعی توی بورس هست؟'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjLLwUUVQZoBhSqNnXZ-_nTRYGw8lglGvXpdWNJHdJY5Wcr2snEkfkU9jkw5xYAvYMb_ZeP8aUbhOQRjb5oSyhTYIdjOwaSi-m5-kFF6AQF-0FyYo3o671AQhHZbemNKBOl89sW/s72-c/dm_process.gif" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-818325826753908908</id><published>2011-06-07T14:25:00.000+02:00</published><updated>2012-05-03T10:43:19.611+02:00</updated><title type='text'>پایان مهلت استفاده از سرویس ترجمه گوگل در برنامه</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;گوگل&lt;a href=&quot;http://blog.gts-translation.com/2011/05/27/breaking-news-google-to-shut-down-translate-api/&quot;&gt; اعلام کرده &lt;/a&gt;که استفاده از ارائه سرویس ترجمه رایگان در برنامه های دیگر را برای سال آینده 2012 ادامه نخواهد داد. یا این ترتیب شرکتهایی که از ترجمه آنلاین گوگل در برنامه هایشان استفاده می کردند دیگر نمی توانند از آن استفاده کنند. حداقل بصورت مجانی نمی توانند.&lt;/div&gt;&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;این می تونه فرصتی باشه برای بقیه شرکتها که بتونن روی سرویسهای آنلاین ترجمه خودشون کار کنن. در ضمن امکان کسب درآمد را برای بقیه می تونه فراهم کنه. البته باید منتظر ماند و دید که آیا این سرویس بصورت تجاری ارائه میشه یا نه و اگر ارائه میشه به چه قیمتی.&lt;/div&gt;&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/818325826753908908/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/818325826753908908?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/818325826753908908'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/818325826753908908'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2011/06/blog-post.html' title='پایان مهلت استفاده از سرویس ترجمه گوگل در برنامه'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-3011733852969119167</id><published>2011-03-28T17:39:00.000+02:00</published><updated>2011-03-28T17:39:47.625+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="بورس تحصیلی"/><category scheme="http://www.blogger.com/atom/ns#" term="فوق لیسانس"/><title type='text'>فوق لیسانس زبانشناسی در آلمان</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;اول از همه اینکه شما می توانید آخرن اخبار بورسهای اروپا و آمریکا در زمینه پردازش زبان طبیعی را در گروه زیر پیدا کنید.&lt;/div&gt;&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;&lt;a href=&quot;http://groups.google.com/group/NLP-dilmaj&quot;&gt;گروه دیلماج در گوگل&lt;/a&gt;&lt;/div&gt;&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;&lt;br /&gt;
&lt;/div&gt;&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;اما اینبار یک بورس کارشناسی ارشد - فوق لیسانس ـ در آلمان برای زیانشناسی رایانه ای&lt;/div&gt;&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;شروع دوره از سپتامبر ۲۰۱۱ هست و بیشتر برای افرادی که در زمینه زبانشناسی کار کرده اند مناسب است.&amp;nbsp; &lt;/div&gt;&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;&lt;br /&gt;
&lt;/div&gt;&lt;div style=&quot;text-align: left;&quot;&gt;&amp;nbsp;The University of Zurich is pleased to announce an innovative Master&#39;s &lt;/div&gt;&lt;div style=&quot;text-align: left;&quot;&gt;&amp;nbsp;degree program in ?Multilingual Text Analysis - Comparative Corpus &lt;/div&gt;&lt;div style=&quot;text-align: left;&quot;&gt;&amp;nbsp;Linguistics?, beginning in September 2011. &lt;/div&gt;&amp;nbsp;The Specialized Master in Multilingual Text Analysis is inspired by &lt;br /&gt;
&amp;nbsp;comparative Corpus Linguistics. It combines Linguistics in English, &lt;br /&gt;
&amp;nbsp;German and the Romance languages with methods and techniques from &lt;br /&gt;
&amp;nbsp;Computational Linguistics. &lt;br /&gt;
&lt;br /&gt;
&amp;nbsp;It has been designed for students who want to complement their interest &lt;br /&gt;
&amp;nbsp;in Linguistics with a qualification in Language Technology. It is also &lt;br /&gt;
&amp;nbsp;suitable for students of Computational Linguistics who want to gain a &lt;br /&gt;
&amp;nbsp;multilingual perspective. Applicants should have a Bachelor degree. &lt;br /&gt;
&lt;br /&gt;
&amp;nbsp;Comparative Corpus Linguistics is a fast-growing discipline, which is &lt;br /&gt;
&amp;nbsp;partly due to the multitude of translated texts that are now available &lt;br /&gt;
&amp;nbsp;in digitialised form. The demand for interdisciplinary skills in &lt;br /&gt;
&amp;nbsp;languages and computers is increasing, which has created many job &lt;br /&gt;
&amp;nbsp;opportunities. Graduates are well qualified for jobs in translation and &lt;br /&gt;
&amp;nbsp;terminology departments of international companies which manage &lt;br /&gt;
&amp;nbsp;documents in multiple languages, and in the rapidly growing field of &lt;br /&gt;
&amp;nbsp;language technology development. &lt;br /&gt;
&lt;br /&gt;
&amp;nbsp;Online-Application: &lt;br /&gt;
&amp;nbsp;&lt;a href=&quot;http://www.google.com/url?sa=D&amp;amp;q=http://www.uzh.ch/studies/application/master/apply_en.html&quot; rel=&quot;nofollow&quot; target=&quot;_blank&quot;&gt;http://www.uzh.ch/studies/application/master/apply_en.html&lt;/a&gt; &lt;br /&gt;
&lt;br /&gt;
&amp;nbsp;Application Deadline: &amp;nbsp;April 30, 2011 &lt;br /&gt;
&lt;br /&gt;
&amp;nbsp;For more information about admissions, tuition, and financial &lt;br /&gt;
&amp;nbsp;assistance, please visit the website: &lt;br /&gt;
&amp;nbsp;&lt;a href=&quot;http://www.google.com/url?sa=D&amp;amp;q=http://www.mlta.uzh.ch&quot; rel=&quot;nofollow&quot; target=&quot;_blank&quot;&gt;http://www.mlta.uzh.ch&lt;/a&gt; &lt;br /&gt;
&lt;br /&gt;
&amp;nbsp;Contact Jeannette Roth, Student Counsellor Multilingual Text Analysis: &lt;br /&gt;
&amp;nbsp;m&lt;a href=&quot;http://groups.google.com/groups/unlock?_done=/group/NLP-dilmaj/browse_thread/thread/d1e3668da7c73e5&amp;amp;msg=52d6d13ed0a87ed3&quot; target=&quot;_parent&quot;&gt;...&lt;/a&gt;@cl.uzh.ch &lt;br /&gt;
&lt;div dir=&quot;rtl&quot; style=&quot;text-align: right;&quot;&gt;&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/3011733852969119167/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/3011733852969119167?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/3011733852969119167'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/3011733852969119167'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2011/03/blog-post.html' title='فوق لیسانس زبانشناسی در آلمان'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-5234735401813756749</id><published>2011-01-06T13:26:00.000+01:00</published><updated>2012-05-03T10:43:19.609+02:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="بورس تحصیلی"/><category scheme="http://www.blogger.com/atom/ns#" term="بورس دکترا"/><category scheme="http://www.blogger.com/atom/ns#" term="سوئد"/><title type='text'>بورس دکترا  در زمینه تکنولوژی زبان - دانشگاه های سوئد</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;&lt;div class=&quot;articleComp&quot;&gt;&lt;h1&gt;Application for GSLT PhD programmes&lt;/h1&gt;Application for PhD programmes in language technology associated with GSLT should be made to the individual institutions involved. &amp;nbsp;We will place information concerning application to the individual institutions on this page as it becomes available.&lt;br /&gt;&lt;h3&gt;PhD positions in Gothenburg&lt;/h3&gt;The Faculty of Arts at the University of Gothenburg has announced &lt;a href=&quot;http://www.hum.gu.se/english/education/doctoral-studies/admission/&quot;&gt;30 funded PhD positions&lt;/a&gt;&amp;nbsp;for graduate studies in the subjects associated with the faculty (including language technology). &amp;nbsp;Deadline for applications is Jan. 24, 2011. &amp;nbsp;The following two graduate programmes in the faculty are associated with GSLT:&lt;br /&gt;&lt;a href=&quot;http://www.flov.gu.se/english/education/doctoral-studies-third-cycle/&quot;&gt;PhD programme in General Linguistics&lt;/a&gt; (&lt;a href=&quot;http://www.flov.gu.se/english/education/doctoral-studies-third-cycle/?languageId=100001&amp;amp;contentId=-1&amp;amp;disableRedirect=true&amp;amp;returnUrl=http%3A%2F%2Fwww.flov.gu.se%2Futbildning%2Fforskarniva%2F&quot;&gt;Department of Philosophy, Linguistics and Theory of Science&lt;/a&gt;)&lt;br /&gt;&lt;a href=&quot;http://spraakbanken.gu.se/eng/phd-program&quot;&gt;PhD programme in Natural Language Processing&lt;/a&gt; (&lt;a href=&quot;http://www.svenska.gu.se/english/education/doctoral-studies-third-cycle/?languageId=100001&amp;amp;contentId=-1&amp;amp;disableRedirect=true&amp;amp;returnUrl=http%3A%2F%2Fwww.svenska.gu.se%2Futbildning%2Fforskarniva%2F&quot;&gt;Department of Swedish&lt;/a&gt;)&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;The Graduate School of Language Technology (GSLT) is a national graduate school for which the University of Gothenburg (Faculty of Arts) is the coordinating host. &amp;nbsp; Participating institutions are:&lt;br /&gt;&lt;a href=&quot;http://www.hb.se/&quot;&gt;University College of Borås&lt;/a&gt;,&lt;br /&gt;&lt;a href=&quot;http://www.chalmers.se/&quot;&gt;Chalmers University of Technology&lt;/a&gt;,&lt;br /&gt;&lt;a href=&quot;http://www.kth.se/&quot;&gt;KTH (Royal Institute of Technology)&lt;/a&gt;,&lt;br /&gt;&lt;a href=&quot;http://www.liu.se/&quot;&gt;Linköping University&lt;/a&gt;,&lt;br /&gt;&lt;a href=&quot;http://www.lu.se/&quot;&gt;Lund University&lt;/a&gt;,&lt;br /&gt;&lt;a href=&quot;http://www.su.se/&quot;&gt;Stockholm University&lt;/a&gt;,&lt;br /&gt;&lt;a href=&quot;http://www.uu.se/&quot;&gt;Uppsala University&lt;/a&gt;&lt;br /&gt;Supervision is also available from&lt;br /&gt;&lt;a href=&quot;http://www.sics.se/&quot;&gt;SICS (Swedish Institute of Computer Science)&lt;/a&gt;.&lt;br /&gt;&lt;br /&gt;The school offers a doctoral programme in language technology. One of its main aims is to provide advanced training in the foundations of both speech and natural language processing technologies. &lt;br /&gt;GSLT is committed to an international profile and welcomes applications from outside Sweden. To be eligible for application students must have an undergraduate degree in an appropriate related field.&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/5234735401813756749/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/5234735401813756749?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/5234735401813756749'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/5234735401813756749'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2011/01/blog-post.html' title='بورس دکترا  در زمینه تکنولوژی زبان - دانشگاه های سوئد'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-6112737.post-8467876662682972340</id><published>2010-12-22T12:13:00.000+01:00</published><updated>2012-05-03T10:43:19.612+02:00</updated><title type='text'>PhD scholarship - Machine Translation, Speech Recognition and NLP - Deadline 9 Jan 2011</title><content type='html'>&lt;div dir=&quot;ltr&quot;&gt;The ?Human Language Technologies? Research Unit of Bruno Kessler Foundation (FBK)&lt;br&gt; is seeking  candidates for three research internship positions in the following areas:&lt;br&gt; &lt;br&gt; -  Statistical Machine Translation&lt;br&gt; -  Automatic Speech Recognition&lt;br&gt; -  Software development for NLP&lt;br&gt; &lt;br&gt; The internship are intended to provide a strong theoretical and experimental background to graduate&lt;br&gt; students interested in applying for a PhD scholarship to start in June 2011.&lt;br&gt; &lt;br&gt; Requirements,  salary, and  application procedure are specified  in&lt;br&gt; &lt;a href=&quot;http://risorseumane.fbk.eu/sites/risorseumane.fbk.eu/files/Call%20HLT_INTERNSHIP2011.pdf&quot; target=&quot;_blank&quot;&gt;http://risorseumane.fbk.eu/sites/risorseumane.fbk.eu/files/Call%20HLT_INTERNSHIP2011.pdf&lt;/a&gt;&lt;br&gt; &lt;br&gt; Closing date: 9 January 2011&lt;/div&gt; </content><link rel='replies' type='application/atom+xml' href='http://blog.dilmaj.net/feeds/8467876662682972340/comments/default' title='نظرات پیام'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment/fullpage/post/6112737/8467876662682972340?isPopup=true' title='0 نظر'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/8467876662682972340'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/6112737/posts/default/8467876662682972340'/><link rel='alternate' type='text/html' href='http://blog.dilmaj.net/2010/12/phd-scholarship-machine-translation.html' title='PhD scholarship - Machine Translation, Speech Recognition and NLP - Deadline 9 Jan 2011'/><author><name>Ali Reza Ebadat</name><uri>http://www.blogger.com/profile/01335297083423745162</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='22' height='32' src='//blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEikm8zpUM9vasnkJP7me-IYPISSnHoCJsmKqRjn3uDlcf-UZ-Z48S-TbijGVti7Fbe6xvhYPnQx6rKHSZG-ReVe_i5_1Cr1zXyR798ql9FqhJNli4xXG-iTJl7J_Ryu240/s220/Reza-side.JPG'/></author><thr:total>0</thr:total></entry></feed>