Въведение
Езикът, за който казахме, е разделен на две категории: естествен език и изкуствен език. Естественият език е езикът, формиран в процеса на човешкото развитие, който е среда, която предава информация между хората. Изкуственият език се отнася до езика, предназначен да бъде проектиран за някаква цел. Компютърният език е вид ръчен език, който се отнася до език, използван за предаване на информация между хора и компютри.
AC информация между хора и компютри За използване на компютърен език. Компютърът е действия, една стъпка, всъщност изпълнява програма, която е компилирана с компютърния език. Програмата е набор от инструкции, които трябва да бъдат изпълнени, като програмите са написани на езика, който сме усвоили. Хората искат да контролират компютъра, да използват компютър, за да решат проблема, трябва да издадат команда на компютъра чрез компютърния език. Наричаме процеса на писане на програмата програмиране, а компютърният език се нарича език за програмиране.
Компютърният език може да се използва за управление на компютри за решаване на някои практически проблеми. Тези проблеми могат да бъдат числени изчисления и техните обекти на работа са някои символни низове, състоящи се от символи; или нечислови изчисления като звук, проблеми с обработката на изображения, техните обекти на работа са звуци и изображения. Трябва да знаем, че всички компютърни езици не са универсални и всеки компютърен език има свои собствени характеристики, предимства и работни среди, има свои собствени приложения и оперативни обекти.
Генериране на предистория
Електронният компютър беше представен и хората разглеждат неговите нечислови оперативни проблеми и избират машинния превод като първия нечислов проблем. Този избор може да се каже, че компютърното нечислово приложение е изключително широко, много лингвистични теории и методи и много технически постижения се генерират и решават на негова основа или вдъхновение. Например въпроси като входни и изходни устройства, големи устройства за съхранение, разпознаване на реч и идентификация на текст са предложени в началния етап на машинния превод. Въпреки това, тъй като машинният превод е сравнително напреднал изкуствен интелект, той все още не е успял да се приложи реално или широко, а други аспекти на изчислителната лингвистика са силно развити. Компютърното разузнаване е въведено в края на 60-те години, а междуконтиненталното извличане е достъпно чрез сателит. С компютрите статистиката на речта се превърна в чести събития. На базата на статистически анализ са изградени голям брой положителни последователности, обратни фрази и честотни речници и са създадени различни корпуси, за да се насърчи раждането на изчислението. По същото време бяха изготвени голям брой указатели и словесен указател. Проблемите с обработката на информацията на големия набор от символи са решени, което осигурява удобни условия за обработка на информация на китайски и други ориенталски езици. Компютърно подпомаганото обучение става все по-зряло и често срещано. Тъй като разбирането за естествен език на важен клон на изкуствения интелект също е положило основата, а автоматичната идентификация на текста, разпознаването на реч и синтезът на реч, като например думи, също процъфтяват. Компютрите също получават все повече и повече приложения в експерименталната фонетика, диалект, граматичен анализ и речник.
Причината, поради която калкулативната лингвистика има такова дългосрочно развитие, се дължи на нуждите на обществото. Днес светът е в революционната ера на новата технология, по целия свят се формира модерна езикова система за обработка на информация, базирана на електронни компютри, което бележи силно развито информационно общество. Компютърната лингвистика се ражда и развива, за да действа като тази историческа мисия.
Основно съдържание
Развитието на изчислителния език до днес, според неговия работен характер и сложност, може да бъде обединено в следните три аспекта:
1 автоматична подредба: Това е най-добрата работа в компютрите и също е най-зрялата част от езика. Статистика, класифициране, сортиране, редактиране на различни термини, индекси и речници, създаване на корпус, терминологична база данни и т.н., са широко използвани. Тъй като тези технологии са доста зрели, има готов пакет, предоставящ услуги.
2 Автоматичен анализ: Това е по-сложен език за автоматична обработка. Тази система за автоматичен анализ работи въз основа на специфична езикова информация, депозирана в компютъра, и целта е да се получи предварително определено заключение, като например компютърна проверка на речника или граматически тест. Ако заключението е невярно, се доказва, че речникът или синтаксисът не са достатъчно пълни и оригиналните данни или правила трябва да бъдат преработени или допълнени. Такива системи обикновено са във фаза на експериментално изследване.
3 автоматично изследване: Това е по-сложен език за автоматична обработка. Тази автоматична изследователска система работи в съответствие с общата езикова информация, съхранена в компютъра, със средствата за статистика, сравнение и класове и т.н. Някои системи за разбиране на естествен език в изследванията на изкуствения интелект работят усилено в това отношение, но няма повече зрели резултати от изследвания.
Класификация
Типът компютърен език е много, като цяло, може да бъде разделен на машинен език, асемблер и език на високо ниво.
Резултати
Може да се каже, че компютърната лингвистика е комбинация от компютри и лингвистика. Тази комбинация даде ползотворни резултати, с изключение на тези теми за приложение, споменати по-горе, тя се проявява и във влиянието на лингвистичната теория и методи. Определението за език е разширено: езикът е не само важен инструмент за комуникация при хората, но и комуникация между човешки машини. За да отговори на изискванията на компютърната обработка, максималната характеристика на компютърната лингвистика е да изисква език, тъй като само формулировката може да алгоритизира, автоматизира. Съгласно това искане са разработени серия от автоматични методи за анализ за езиково-ориентирана обработка на информация, включително предсказуем анализ, в зависимост от аналитични методи, междинни компоненти, за предпочитане семантични, разширени мрежи за трансфер и концепции от принадлежност и други подобни. Тези автоматични методи за анализ са приложени в системата за машинен превод и разбиране на естествен език и се оказват ефективни. Формализацията на езика е многослойна. Формализирането на граматиката е сравнително просто, хората са положили много работа; формализирането на семантиката е сложен проблем и хората нямат много работа. Семантичният формален проблем се решава по-добре и ще повлияе значително на ефективността на автоматичната обработка на езика. Следователно, продължаването на ефективната форма на методите за структурен анализ и методите за семантичен анализ, изучаването на връзката им между тях и обсъждането на техните ограничения в различни системи, което е ключова изследователска тема в компютърната лингвистика.
Компютърът от пето поколение изисква от хората да го присвоят на слух (идентифициране на говорене) и по-силно зрение (автоматична идентификация на текст), дава му възможности за говорене (синтетични думи) и възможности за диктовка (гласово въвеждане) и също така изисква Дава му да разберем естествения език и да преведем някои (или повече) естествени езици в друг (или повече) способността на естествения език. По този начин компютърният лингвист трябва да предостави данни и различни приложни софтуерни аспекти на физическите параметри, езиковата вероятност и т.н., така че експертът, инженерът да бъдат решени съвместно да добавят „крила“ към компютъра, за да стане той наистина „универсален интелигентен машина".
Изпълнете горните задачи и трябва да разчитате на усилията и сътрудничеството на целия език. Въпреки че има уникалност на машинно-ориентирания език, той ще бъде печка по много начини, но практиката доказва, че основният език на традиционната лингвистика има голямо отношение към решаването на някои нови задачи, като например традиционното английско и китайско сравнително езикознание . Това ще осигури голямо удобство на машинния превод от английски на китайски. В този смисъл компютърната лингвистика може да получи само бързо развитие на резултатите от традиционната лингвистика и трансформация.
Hotspot
Струва си да се спомене, че машинният превод е важен клон на изкуствения интелект и първата област на приложение. Въпреки това, в случая на съществуващия машинен превод, качеството на превода на системата за превод е далеч от крайната цел; и качеството на превода е ключът към успеха или провала на системата за превод. Китайски математици, професор Zhou Haizhong, каза в статията "50 години" във вестника: За да се подобри качеството на превода, първото нещо, което трябва да се реши, е самият език, а не проблемът с дизайна на програмата; сама Системата за машинен превод не трябва да подобрява качеството на машинния превод. В допълнение, в случай на това как е направена церебралната размита идентификация и логическата преценка, преводът трябва да бъде невъзможен за достигане до „Буква, Da, Ja“.
Приложение
Език за изчисление и обработка на информация от естествен език Изследване Изследване чрез разбиране на езика и автоматично генериране (LanguageGeneration). Бившата разпознаваща синтактична структура от повърхностния слой на изречението преценява семантичната връзка между съставките и накрая получава значението на израза на изречението; последният ще избере думата от значението на значението, според семантичната връзка между думите, конструира всяка съставка Семантичната структура и синтактичната структура между семантичната структура и синтактичната структура, накрая съобразени с граматиката и логиката.
Компютърната лингвистика е като другите дисциплини, има две нива на научно изследване и технология. Целта на научните изследвания е да се открие присъщият закон на езика, да се изследват методите за изчисляване на езиковото разбиране и генериране, основните ресурси за изграждане на езикова информация; и техническите изследвания се ръководят от целта на приложението, в съответствие с действителните нужди на обществото, проектиране и разработване на практически езици Система за обработка на информация.
Целта на приложението за обработка на информация на естествен език е комуникацията между хората на естествен език. По-конкретно, това е да се създадат различни компютърни приложни софтуерни системи за обработка на естествени езици, като машинен превод, разбиране на естествен език, гласова автоматична идентификация и синтез, автоматична идентификация на текст, компютърно преподаване, извличане на информация, автоматично класифициране на текст, автоматично резюмета, Има извличане на информация в текста, интелигентно търсене в Интернет и различни електронни речникови и терминологични бази данни.
С широката популярност на Интернет социалното търсене на обработка на езикова информация се увеличава и има спешна нужда от използване на автоматизирани средства за обработка на масивна езикова информация. Въпреки това, поради ограниченията на развитието на теорията на дисциплината и сложността на самия китайски, изследването на компютърната лингвистична теория и методи на моята страна не може да осигури достатъчна подкрепа за разработването на китайски приложения за обработка на информация. Една от годините на изчисляване на лингвистиката и обработката на естествен език в Китай е, че целта на изследването на приложенията и практическото развитие на системата е по-ясна, относително инвестиция и са постигнати някои резултати; изследванията на основните теории и методи са относително слаби. Проучването и тенденцията на развитие от периода 1998-2002 г. все още са в сила. В различните приложни цели, описани по-горе, проектите, в които е концентрирана изследователската сила, са: извличане на текстова информация, автоматично класифициране на документи, автоматично резюме, гласова автоматична идентификация, машинен превод и извличане и филтриране на текстова информация. В допълнение, изграждането на езикови ресурси и базираните на езика методи за езиков анализ, базирани на корпус, също бяха особено загрижени и отбелязаха по-бърз напредък.