Нашли или выдавили из себя код, который нельзя назвать нормальным,
на который без улыбки не взглянешь?
Не торопитесь его удалять или рефакторить, — запостите его на
говнокод.ру, посмеёмся вместе!
— и пропускаем через неё входную сорцовую психозу. Настоящий «OCR»!
Благодаря тому, что на английских символах модель не обучалась, при распознавании сорцов получается кобенный эффект.
Моделька обучается очень быстро, десятка эпох (примерно по секунде на эпоху на моём корыте) достаточно для 97-98% точности распознавания искажённых символов.
Есть идея добавить эффект «Файнридера»: он, когда встречает слово, в котором много букв распознались ненадёжно, подбирает под имеющийся шаблон слово из выбранного словаря (например, из словаря русского языка). Так получается «турель» и другие слова, которых в исходном тексте не должно быть.
На «Денди» в играх часто было «urpok» вместо «игрок». А ещё было «АГА» и «НЕ» вместо «ДА» и «НЕТ», чтобы по количеству буков совпадало с английским вариантом «YES» и «NO».
Я не просто русифицировал, я рисовал шрифт для одной игры, причем в paintbrush. Шрифт был пиздец кривой, но читать можно было. И да: количество символов должно было совпадать
Конкретно эта — нет, она выдаёт вектор из CHARS_NUM элементов («one hot vector»). Перевести его в изображение можно, но это будет просто шум, возможно, похожий на тепловую карту.
Для генерации нынче модно использовать «GAN» («генеративно-состязательная сеть»): по сути две сетки, одна из которых (A) определяет, насколько «реально» изображение (для реальных фоток желаемый выход = 1, для фейковых — 0), а другая (G) на основе белого шума генерирует изображение. Обучаются они вместе: во время обучения G должна выдавать такие изображения, чтобы A на них выдавала 1, а A должна выдавать для них 0. В результате получается качественная питушня. На https://thispersondoesnotexist.com/, например, именно так и генерируются лица.
Мне интересно, как татары читают время в британском формате, например, 10:00 AM. В тюркских языках «ам» — это очень неприличное слово: https://ru.wiktionary.org/wiki/ам#Казахский (статьи про татарский нет, но там оно означает то же самое)
Ам по-казахски пизда, это все знают. Не знаю, во всех-ли тюрксикх так.
Кстати, о тюрксих языках:
«Чолбо́н» (по-якутски «утренняя звезда», Венера; в якутской мифологии Чолбон — дух-хозяин звезды, который насылает на Землю холод) — российская якутская рок-группа из села Хомустах (Намцы) Верхневилюйского улуса Республики Саха (Якутия), основанная в 1986 году.
> А что в оригинале даёт «задраенную»?
Не знаю, психоза до стадии файнридера не сохраняется, а после сохранения-загрузки модели детерминированный результат почему-то не выдаёт.
Самый-самый оригинал (из кода) задраенной — «sample_num», гваяковой — «rng_state», земляные — «set_size» (это всё код из стартового поста).
Собственно, с «--use-substitution» скрипт для каждого слова (непрерывная последовательность кириллических символов, отделённая любыми другими) пытается подобрать соответствующее словарное слово, если «неуверенных» букв в исходном меньше половины его длины. Например, если модель выдала «баXор», и у буквы «X» «уверенность» будет меньше 0.9 (--confidence-threshold, у всех русских символов оно обычно больше 0.95), скрипт попытается найти в словаре все слова по шаблону «ба?ор», а потом выберет из них рандомное.
>скрипт для каждого слова (непрерывная последовательность кириллических символов, отделённая любыми другими) пытается подобрать соответствующее словарное слово
Ага, я вчитался и понял что это не годный ворец-рандом, а какая-то побочка.
Даже использование простых вореантностей гласная-согласная, сильно улучшит качество слов.
Систематически вопрос о зависимости букв алфавита в открытом тексте от предыдущих букв исследовался известным русским математиком А. А. Марковым (1856 – 1922). Он доказал, что появления букв в открытом тексте нельзя считать независимыми друг от друга. В связи с этим А. А. Марковым отмечена еще одна устойчивая закономерность открытых текстов, связанная с чередованием гласных и согласных букв. Им были подсчитаны частоты встречаемости биграмм вида гласная-гласная (г, г), гласная-согласная (г, с), согласная-гласная (с, г), согласная-согласная (с, с) в русском тексте длиной в 105 знаков. Результаты подсчета отражены в следующей таблице:
. Г С Всего
Г 6588 38310 44898
С 38296 16806 55102
Статистика интересная, не задумывался, что для гласных-согласных такая разница будет. А на цепочках Маркова из N-грамм ещё классический кобенный генератор работал, да.
https://pastebin.com/vCd3wtjg
На каждой строке — 200 переводов одного английского символа. Порядок строк — «abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLM NOPQRSTUVWXYZ».
Дополнительную случайность ещё вносит случайное искажение входных изображений.
Кручу гиперпараметры, наблюдаяю.
значит, аккорды первые такие: (поевле) сакомаелся на трубу. вщё, бова цеверок говолони, каканыя я нам раз пядорм. на работ пошел… надо попуда, блядь, сука исаа, соенав пошал, улядь? оу иеся! яотча! бляк… хоть! . муж ч оооори, барилие эху день? натину, и выперее к тебе (впивается.) бладим, тож а тепере, но блядь, я те е воё, посдом настротьн ятоо живою спл(ки… ноже, мотс мут, тогда пошу, будуте вотовол, ты чой хлрешь я! (оленнй изеёё витан! вставае есты, не зененый слязыйся! на парод пазвывался не парьто бадет.
Да.
Предварительные результаты: примитивный рекуррентный марковоподобный кобенный генератор (1 LSTM-слой), обученный на длинных N-граммах (30 символов на вход — 1 на выход; генерация — 30 начальных символов + остальные в том виде, в котором их выплёвывает сетка) выдаёт мелкодисперсную психозу, в которой явно наблюдается соблюдение частотных характеристик исходного текста, но практически полностью отсутствует кобенное поле в силу малости реальных слов.
Сейчас обучаю этот генератор на текстах Ницше, поверблюдаем, как оно там будет.
Да, похоже, для примитивного марковоподобного генератора питушня как выше — предел. Ницше застревает в одной точке с маловразумительным выводом:
ская предвзятость и задушевность по отношению к сосом н, носомат намим ни ие и сосом не и и посом е в сомит сосом м восам м и сосом не иосам ни носом е, восом т насом ни носота насим ни иесам ни и
и иена и ие сосомае насим ни носом сасати и и ни и сами и нами и иосомат сасом н, восомат намим ни и носомат сосом м, восомат насом не носом насами и м на и и сосим на и н нами насим ни ие и сосом нами на и н сомие сосом нами ни и о сомит ни и н сомит насом н, восомат намим ни ие и и сосом м о ие и самим насом не но
В случае со слоником — да, там очень мало данных и сетка по сути зубрит его (точность во время обучения была что-то около 95%). А для Ницше, скорее всего, надо более длинные цепочки, больше нейронов и вообще лучше подобрать гиперпараметры.
Но вообще, генератор такого типа представляет из себя просто приближённую цепь Маркова с очень длинной цепочкой, и генерировать может только психозу, которая на исходный текст похожа только частотными характеристиками символов (пунктуацию, кстати, я не правил — сетка сама «догадалась», что после запятых всегда идёт пробел, а после пробела — другой символ). Чтобы создать более высокосинтаксильный генератор, у которого выходная психоза обладает мощным кобенным полем, надо подниматься на уровень слов, предложений и документов, чем наш исследовательский отдел и занимается.
Просто как я понял из других областей, где применялись нейросети обычные «тупые», старые-добрые алгоритмы в некоторых моментах дают лучшие результаты, при высшем пирфомансе.
Но там нужно руками подкручивать.
А наиболее аутентично это конечно кобенировать сеть в сочетании с императивной классикой.
Самое сложное понять в каком месте алгоритма должна быть сеть, а в каком алгоритм.
Но есть rule of thumb: сеть должна быть на месте эмпирических параметров и магических цифр. То есть сети хорошо решают задачу питумизации и локальных минимумов.
В моём случае это вручную выбранные частоты замены. Или допустим те же правила грамматики.
Да, нейросети, при наличии эффективных детерминированных алгоритмов, сосут.
В случае с ТУРЕЛЬЮ, возможно, нейросеть вырвется вперёд, если будет тренироваться на распознавании текста целиком, а не посимвольно. А в текущем варианте это действительно просто недетерминированная замена одних символов на другие, которая отлично решается классическим алгоритмом.
Здравствуйте Мартин Алексеевич! Дождь был вечером хорошо что я всё накрыл и ещё в сарае убрал а то бы промокло всё. Я вот опять один тут мудохаюсь а вы там только клубничку с молочком любите да картошечку с маслицем а я тут один. А вы вон как дом на вас записан а мы значит мордой не вышли и теперь нас поджопник! Вот как теперь мы работаем и нас побоку. А я вот что скажу ты не професор а хуесор ты анекдотики хуётики всё а я тебе общественность все подниму чтобы ты гад сраный не мог нас как мы работаем а ты нас срать и всё. Я срать не могу на нас срать чтобы а мы работать и гады сраные. Мы всё просветить а ты говна чтобы професор сраные и гадить на нас. Мы не хуесор а ты гадский и я ебал гадский говно. Я тебя гадский а ебал чтобы нас работать говна. Я тебя ебал гад. Я тебя ебал гад сраный я тебя ебал говна сгатые. Я тегя ебел смагы могол. Я тег егало срады могол. Я тег егадо сданы могол. Я тегя егадо могод пога. я тега могод пога сдагы ебаг. я тега сданы погод ебад мого. я теда магол ега сданы мого. я тега модо тага годо ега сдана модо. я тега домо тага модо тега сданы мого. я тега мого дана тага слада мого ега тага, я тега тага модо гада ега мого така я мого тага сдана тега мого лага я мого тега сдана мого ига тага я гега мого тега сдана ега мого я гома тага нада мого тега тага мога пото мыга лага тыга я гега мага лыда тега водо тига мого тару мага лыга гадо вого мара тога сана пира тога лага пира вока лака нира.
Zgna8cfBvйfe Maftvn Ajlekcee8vu! Дomgb bbljl Beuebow xonowo 4to r 8ce nakpbljl u ew,e 8 canae y6qajl a to bbl hnomokjlo Bce. R 8ot onafb ogvh tyf mvdoxaюcb a Bb1 tam fojlbko kjly6nv4kv c mojlovkow jlю6ufe da kaqtoweuky c wacjluu,ew a r tvt odun. A Bbl 8oh kak gom na 8ac zahucah a wb1 zuauvt wofdoй ne 8blwjlv v fehenb uac podmopnvk! Bof kak fepebb mb1 pabotaem v hac no6oky. A a 8ot ufo ckawy fb1 he npodecon a xyecop fb1 anekdotuku xyetukv 8ce a a fe6e obw,ect8eunocfb 8ce noghvmy uto6b1 fb1 rag cqahblй ue wor uac kak wbl babofaew a fbl hac cbatb u 8ce. R cbafb ne worv ha hac cpatb vto6b1 a wbl pabotafb u radb1 cpanb1e. Mb1 Bce hqocBefufb a fbl ro8ua 4to6bl hpodecob cqanble u radutb ha nac. Mb1 ue xyecoq a fbl ragckuй v r ebajl ragckvй roBno. R tebr ragckuй a e6ajl 4fo6b1 hac pabotatb ro8na. R tebr ebajl rag. R fe6r ebajl rad cqaublй r te6r ebajl roBna crafble. R fera e6ejl cwarbl morojl. R ter erajlo cfagb1 morojl. R fer erago cdahbl morojl. R terr erago worog hora. r tera morod nora cgarb1 ebar. r tera cganb1 horog ebag woro. a fega marojl era cdahb1 moro. r tera mogo tara rogo era cgaua mogo. a fera gowo tara wodo tera cganb1 woro. r fera woro daua fara cjlaga moro era tara, r tera tara wogo rada era moro faka r woro tara cgaua tera woro jlara r woro fera cgana moro ura fara r rera moro tera cdaua era moro r rowa fara hada moro tera fara wora pofo wb1ra jlara fblra r rera mara jlb1da fera Bodo tura moro taqy wara jlblra rago Boro maba tora cana nvba tora jlara nvba Boka jlaka uuba
Sgfавст8yйfe Мabтuu Aлeксеeвич! Dождb 6blл 8ечеpоm xoqоwo чтo я 8cё нakfыл и ещё в cafае vбfajl а fo бы пpoмоkлo Bсё. Я вoт оhяtb один тyт mуdохаюcb а Bbl там тoлbkо клубни4kу с wолоuкоm jlюbитe da каqfowе4kv с macлиu,eм а я туt одuн. А Bbl вoh kак дом нa Baс запucаu a мbl зна4ит mордoй нe вышлu и теpeрь nас pogwопhuk! Вoт как tеhерb mы pаботаeм и hас пoбoку. А a вот чto ckawу ты hе pnoфесoр а xуесор tы анекdofикu хyeтvkv Bce а я teбe o6w,есtвeuносtb 8ce pоgnuмy 4toбbl tы rаd cрaнblй uе мoг наc kak мы ра6отаеw а tbl uас сfafb и вcё. R сfатb nе wоry ha нaс cраtb чfo6ы a мы naбofafb и rаgы срaнb1е. Мbl вce npоcвetvfь а tb1 rоBnа чfо6ы пfoфеcoр cfаные и гaguтb na нас. Мbl he хvесоf a tb1 ragсkий u r eбajl raдcкuй rовno. R teba raдcкuй а ебал 4тоbы haс naбоfaтb ro8нa. R tебя ебaл rад. R те6r ебaл гаg cbанblй я те6я ебал гoBnа сгатble. R тeгr ебел cmагы мoгол. R teг егaло cраdы wоrojl. R тer erадо сgаны мoгоjl. R тегr еrадо моrоg nога. r теra мoгoд пога сgагы e6ar. r ferа cдаhы поrоd ebаg мoгo. я fеда mагojl еrа cданb1 могo. я tега модо таra гogо ега сdаhа модо. a теrа gоwо tаra mодо тeга сдahы mогo. a теrа moгo dаnа fага cлаdа moгo eга таrа, r тerа fага mogо гада era мого тaka r мorо тarа cdaнa теra моrо лаrа я мoго тeгa сgаna wогo иra tarа a гегa моro теrа cgаuа eга moгo r rowа тara hадa мoго тera taга моra hoтo мыга jlaга тыra я гега маra лыдa тerа воgo тиra moго taру маrа лb1га гago 8oro wарa тoга caha пирa тоra лaгa nира 8ока лаka ниqa
ЗgpаBствyйте Мaрtиn Аjleксеевu4! Доmdь был 8e4еpоm хороwо чтo a всё naкрb1л и еw,e в сapае у6рajl а то бbl прoмoкjlо вce. R 8oт оnaть оduн туt муgохаюсь a вы тam тольko kjlyбничkу c mojloчкоw любute да каpтoweчky c macjluцew a я tуt oдuh. А 8b1 8он kак dом нa ваc зaпиcaн a мы 3нaчut моpдoй he Bblшлu u теnepь нaс nоgmоnнuк! Bоt kak teпеpь wы рабоtаеm u нac пobоку. А r вot чtо ckaжу тb1 hе проfeсop а хуеcop тbl аheкдотuku xyetukи всe а я tебe общеctBеnнoсть вcе nodnиму 4tоbbl ты rad cраnый ne woг наc каk wы pабоtаеm а ты нас cpаtb и всe. Я cратb нe могy нa hаc сpaтb 4to6ы а mы pa6otатb и rаdbl cраhые. Мы 8cё пpoc8etuтb a tb1 roвhа чтобbl nроdеcop cраhb1e u гадить нa нac. Mы нe хуесор a ты rадский и a ебал гадcкий гoBно. R tеbя raдckuй а e6аjl 4tоbb1 нaс pабoтатb го8ha. R тебя ебajl гad. Я te6я e6ал гаd срaный r tebя eбал гoBна cгаtыe. Я teгя e6eл cwаrы morол. R тeг егаjlо сpagb1 могол. R ter еrадо cдаnbl моrojl. R тегr eгaдо моrод пora. я тeгa mогод nora cgaгb1 eбaг. a теrа сgаnbl погоd еbад woгo. я теga maгoл егa cдаhb1 worо. a тегa modо tаra rоgo era сgана wодо. я теrа дoмо таrа мodо тerа сданbl morо. r тerа mоrо gaна tarа сjlадa мoro erа tаra, a теrа тагa моdo raдa еrа мoro таkа я мого тarа cgaнa тeгa moгo jlarа a wоrо tега cдаna moгo uга тaгa я геrа mоrо tеrа cдaна era moго я rомa тara нaдa могo теra тага wогa noтo мblra jlага tыга a rегa mагa jlb1да tеra вogo тигa moro тaрy mara jlb1ra гаgo Bогo mара toга саhа пuра tога лarа пuрa Bока лaka нирa.
Здравствуйте Мартин Алексеевич! Дождь был вечером хорошо решают задачу питумизации и локальных символов (порядка пары процентов), чтобы был файнридер-эффект. А он крупный, там 1.6кк слов (со всеми склонениями)
Он фуфловый. Я сначала повёлся, но потом он начинается фаза повторить.) у тебя не получаеь вольть брял, деси кака довой, бешь восомат сасом н, восом т насом н, носомат сосом н, носомат сасом н, восомат сасом н, восомат насом не носом нами ни и о сомит насом ни носом е, восом т насом не носом сасати и и ни и сами и м на и и сосим на и н сомие сосом нами насим ни ие и сосом не иоса#вореции
Кстати, ещё я заметил «фазы» обучения, влияющие на выходную психозу:
1. В самом начале сеть просто повторяет самый частый символ — пробел.
2. Следующие несколько поколений сеть продолжает выдавать один символ, но изменяет его (обычно это «е», «и», «а»).
3. Далее начинается фаза повторений n-грам, обычно это сочетания высокочастотных букв и пробела, иногда — слоги «еа», «еи» и так далее. К концу фазы сеть может повторять довольно длинную цепочку символов.
4. В следующей фазе начинается околослучайный разброс пробелов и частых символов.
5. И, наконец, в последней фазе появляются слова и пунктуация — её я кидал выше.
Об этих вореволюционированиях писал Чуковский в книге про биологические нейросети от джвух до пяти.
Сначала кобеноза просто издаёт непонятные звуки. Потом она формирует из них какую-то последовательную питушню, начинается фаза зожатия предложений в пару слогов ("Извольте подать мне карету к шести часам!" -> "иам!") Потом постепенно оно кобенирует отдельные слова и предложения.
Вячеслав, как раз наоборот, принцип одной мухи это догма. Личная догма, или догма сообщества, которую ты принял, и по которой живёшь. Я думаю, в твоём случае, это догма уже в тебе живёт сама по себе, и у тебя с ней гармония.
Почему догма? Потому что в словосочетании есть слово "ПРИНЦИП".
Понятно. Жизненные принципы у тебя есть , ты по ним живёшь, и они привязаны к сообществу (церкви).
Если по аналогии твоих жизненных принципов, то твой "принцип одной мухи", возможно, привязан к сообществу, в котором используют такой принцип. Но поскольку ты задал вопрос . , то у тебя нет привязки к сообществу , которое использует "принцип одной мухи". Но, возможно, ты сам хочешь понять надо тебе это или нет. Хотя, я думаю, ты уже давно сделал себе выбор.
function vorefy(text,subst)
{
var out = "";
for (var i=0;i<text.length;++i){
var s = text[i];
out+=vrc(subst[s],s);
}
return out;
}
function vrc(replace,s)
{
if (null == replace) return s;
var r = Math.random()*200, probability=0;
var max={v:0};
for (const [k, v] of Object.entries(replace)) {
probability += v;
if (max.v<v) max={v:v,k:k};
if (r<=probability) return k;
}
return max.k;
throw "not found for: "+s+" "+replace;
}
vorefy(`int main()`,subst) //subst мапа которую я постил
Питушня как выше — предел. Ницше застревает в одной точке с маловразумительные результаты, при высшем пирфомансе.
Но там нужно ставить мапу русских символов, отделённая любыми друг от друга. В связи с этим А. А. Марковым отмечена еще одна устойчивая закономерность открытом тексте нельзя считать независимыми другими) пытается подобрать соответствующее словарное слово
Ага, я вчитался и понял что это не годный ворец-рандом, а какая-то побочка. А вот без побочек:
#;! 'беттпеИгВООЗТ_А5ТО_ОЗЕ_ВООБТ_ВАТЕ_Т IМЁ)
гетигп х_зет, у_зет Да, красиво. Притом что алгоритмом. Здравствуйте Мартин Алексеевич!#вореции
Некачественная питушня какая-то. Надо мапить не только lookalike-слова брало, либо вообще, генератор такого типа представляет из себя просто нормальные буквы? Конкретно эта — нет, она выдаёт вектор из CHARS_NUM элементов («one hot vector»). Перевести его в изображение входных будет легче.
Эффект ворецирование простых вореантность по отношению к сосом н, носомат сосом м восам м и сосим на и н сомит ни и носомат сосом м восам м и сосим на и н сомит ни и носомат насом не но Я небольшой специалист по нейросетям и LSTM.
Но допускаю что слоником — да, там очень мало данных она может повторять#вореции
Нeкa4eсmвeннaa nиtywня каkaя-тo. Hаgo manuть нe тoлbkо lookalike-сjlовa 6рaлo, лu6o 8оobщe, reнeратоp тakоro тиna npeдctaвлaет из себя пpoсmо нoрмальныe 6уkBb1? Koнkpеtно 3та — nеt, ona вblgaeт вektop и3 CHARS_NUM 3лemenmoв («one hot vector»). 1Tеpeвecmu eгo в u3оbрaxkeнue вхogныx bудem лer4е.
Эqpфekm вopeцupовaнue пpоctыx вopеaнtнocmь no omношeнuю k coсоm h, нocomat cocom м вocаm m u cосим нa u h comut нu u ноcоmam сocom m вocam m u cосuм hа и н comuт нu u ноcomат насom nе no Я не6ольшoй спецuaлuсt no нейpocеmяm u LSTM
>Я nokoрмuл gpeвнuй ko6ehhoй алroрutm кommентapuamu с 3toй стрahuцbl. 1DzA-- за6omливо соxpaнил юзеpckpunm c кnoпkoй «0mвemumь брegom»:
>Я nokopmuл дрe₈нuй koбenнoй алroputm kоmmeнtарuяmu c 3mой сmрaнuцы. I0ZA-- зabotjlиBo coxpанил юзepckpuпт c kнопkoй «Omвеtuть 6pеgoм»
Эфdeкt воpециpoваниe nроcтых воpеaнthoсть no отnoшehию к соcom н, нocомат сoсоm м 8оcам m u cоcиm на u н сoмuт hи u nосoмаt cocom m Bоcам m u соcим na u н соmиm hu и hосомam нacoм не nо R нeбoльшой спеu,uалuст no neйросеtям u LSTM.
Ten głos nawiedzał mnie
przybywał w snach.
Wymawiał imię me
aż nastał brzask.
I chyba dalej śnię
lecz razem z nim.
To on
to upiór tej opery
ma we władzy sny.
Niezwykły duet nasz
usłyszy noc,
bo mam nad tobą już
nadludzką moc,
a choć odwracasz się
spoglądasz w tył.
To ja
to upiór tej opery
mam we władzy sny.
Kto widział twoją twarz
ten poznał strach,
dla świata maskę masz
świat głos mój zna.
W harmonii splata się,
i głos i myśl.
O tak
to upiór tej opery ma
we władzy sny.
To on to upiór tej opery
ten duch to upiór tej opery.
Fantazji odrzuć dziś
nieostry kształt,
bo czas by miała już
Twój głos i twarz.
Noc labiryntem jest
zabłądźmy w nim,
o tak
to upiór tej opery
ma we władzy sny.
Hawjlu ujlv 8b1da8ujlv uz ce6a rog, kotobb1й uejlbza hasbafb hobwajlbnb1m, ha kotoqblй bez yjlb16rv ue Bzrjlauewb? He fobonutecb ero ygajlrfb ujlu nefakfofufb, — sahocfvte ero ua robuorod.by, hocweewcr 8mecte!
Hawjlv vjlv 8blga8ujlv uz ce6r kog, kotobblй uejlbzr nasBafb hopmajlbublm, ua kofobb1й 6ez yjlb1bkv ue Bsrjlrhewb? He fobopvtecb ero ygajlrfb ujlv fedakfonufb, — zapocfute ero na roBnokod.by, nocmeemca Bwecte!
https://gcode.space/#!/search?user=3.14159265, там поискать по слову «var». Куча скриптов, в том числе и из удалённых постов. Именно поэтому я за «Борманда». (TODO: строку поиска в параметры)
У меня на каком-то старом винте остались всякие ворец-юзерскрипты, которые я не так и опубликовал.
Всякие экскременты с марковскими цепями. Я даже толком не помню что там.
О, шо нашёл: https://govnokod.ru/12506#comment169134
>>> И поэтому в кои-то веки внесли хорошее предложение расширить js словом let, что и сделали добрые дяди из мозиллы.
Питушня. У дяди Пи был скрипт, который убирал кобентарии всех вайперов без фантазии. Скрипт работал без указания ников, айдишников, стоп-слов, пиратов, живых людей, фирм и физических лиц.
var fireClick= function (i,e){ $(e).trigger('click'); },stat=function(i,e){ var text=$(e).text().toLowerCase().replace(/\s+/g, ''); if (!cmt[text]) cmt[text]=[]; cmt[text].push(e); }, cmt={}; $('div.entry-comment').each(stat); $('span.comment-text').each(stat); for (var msg in cmt){ var arr=cmt[msg]; var len=arr.length; if (len>2) for (var i=0;i<len;++i) if (arr[i]) $(arr[i]).parent().hide().find("a.comment-vote-against").each(fireClick);}
Питушня какая-то. Надо мапить не только по похожести, но и по высоте букв. Если сохранится форма слова, читать будет легче.
Эффект вореций уоunuтся. Cноqээ всего.
Впервые идея использовать индейские языки для пересылки шифрованных сообщений была опробована ещё в Первую мировую войну, когда восемь членов племени чокто служили на европейском театре военных действий.
Идею использовать язык навахо первым высказал ветеран Первой мировой войны Филип Джонстон — сын миссионера, работавшего в этом племени; он родился в резервации и был одним из немногих неиндейцев, говоривших свободно на языке навахо. В 1942 году племя навахо насчитывало около 50 тысяч человек; их язык необычайно труден для изучения и, кроме того, в годы войны был бесписьменным. Никто не зафиксировал не только своды грамматических правил, но даже не был составлен элементарный алфавит. В языке навахо есть звуки, не имеющие аналога в европейских языках, поэтому человеку, если он не принадлежал к племени индейцев навахо, выучиться языку было почти невозможно. Военные лингвисты провели исследование и доложили командующему десантными силами Тихоокеанского флота, генерал-майору К. Вогелу, что язык навахо понимают не более 30 американцев, не принадлежащих к племени. Когда правительство США обратилось к вождю племени Навахо с просьбой отпустить индейцев участвовать в боевых действиях на Тихом океане; вождь ответил, что «Нет больших патриотов Америки, чем коренные американцы», разрешение было получено; после этого начали собирать и обучать первую группу радистов навахо.
В мае 1942 г. была собрана первая группа навахо из 29 человек, которая прибыла на специальную базу Пендлтон (Оушенсайд, Калифорния) и приступила к разработке шифра. Они называли себя «windtalkers», что значит «говорящие с ветром».
Многие термины, с которыми радистам приходилось работать, не имели эквивалента в языке индейцев навахо. Поэтому при разработке шифра были созданы около 450 оригинальных обозначений, отсутствовавших в языке навахо. Так, «беш-ло» («железная рыба») обозначало подводную лодку, а «дибе-ли-зини» («чёрные овцы») — взвод.
Первоначально радисту нужно было перевести каждое слово из сообщения на английский. Затем он брал только первую букву английского слова. Так, слова «би-ла-сана» (apple, «яблоко»), «уол-ла-чи» (ant, «муравей») и «це-нилл» (axe, «топор») обозначали букву (а). Поэтому, чтобы передать в сообщении — например, слово «NAVY» («Флот») — радист передавал следующее: ца (Needle, «игла») уол-ла-чи (Ant, «муравей») а-ке-ди-глини (Victor, «победитель») ца-ас-зи (Yucca, «юкка»).
Мне кажется гораздо идиоматичнее OCRa.
OCR слишком сильно шумит спецсимволами. Для идиоматичного вывода их надо приглушать, возможно, вручную веса снижать.
Добавил в тренировочные сеты немножко английских букв:
А что, тут кто-то не русифицировал программы в hex-редакторе? Знатная была забава.
Для генерации нынче модно использовать «GAN» («генеративно-состязательная сеть»): по сути две сетки, одна из которых (A) определяет, насколько «реально» изображение (для реальных фоток желаемый выход = 1, для фейковых — 0), а другая (G) на основе белого шума генерирует изображение. Обучаются они вместе: во время обучения G должна выдавать такие изображения, чтобы A на них выдавала 1, а A должна выдавать для них 0. В результате получается качественная питушня. На https://thispersondoesnotexist.com/, например, именно так и генерируются лица.
PS, БОГОУГОД! ГЕТЕГЕПСЕ!
Какой кагор )))
Годнотааа!
А что в оригинале даёт «задраенную»?
>гетцгп х_зет. ужмет
Зожатие — наше всё!
https://ru.wiktionary.org/wiki/ам#Казахский (статьи про татарский нет, но там оно означает то же самое)
Кстати, о тюрксих языках:
«Чолбо́н» (по-якутски «утренняя звезда», Венера; в якутской мифологии Чолбон — дух-хозяин звезды, который насылает на Землю холод) — российская якутская рок-группа из села Хомустах (Намцы) Верхневилюйского улуса Республики Саха (Якутия), основанная в 1986 году.
У меня переключатель языков в голове стоит. И когда он установлен в "английский", "who you are" не кажется чем-то неприличным.
Who it are.
Ypog*
>гваяковые
Что в оригинале?
Не знаю, психоза до стадии файнридера не сохраняется, а после сохранения-загрузки модели детерминированный результат почему-то не выдаёт.
Самый-самый оригинал (из кода) задраенной — «sample_num», гваяковой — «rng_state», земляные — «set_size» (это всё код из стартового поста).
Собственно, с «--use-substitution» скрипт для каждого слова (непрерывная последовательность кириллических символов, отделённая любыми другими) пытается подобрать соответствующее словарное слово, если «неуверенных» букв в исходном меньше половины его длины. Например, если модель выдала «баXор», и у буквы «X» «уверенность» будет меньше 0.9 (--confidence-threshold, у всех русских символов оно обычно больше 0.95), скрипт попытается найти в словаре все слова по шаблону «ба?ор», а потом выберет из них рандомное.
Ага, я вчитался и понял что это не годный ворец-рандом, а какая-то побочка.
Осталось методом Монте-Карло собрать статистику и сгенерить таблицы замены.
Каждому английскому символу сопоставить мапу русских аналогов, и вореантность подстановки данной кобенации.
И можно переводить на «JavaScript».
Он фуфловый. Я сначала повёлся, но потом он начинает раздражать неестественностью.
Надо или трешхолд очень сильно поменять, чтобы только lookalike-слова брало, либо вообще его выкинуть.
Гораздо лучше будет взять диграммы, триграммы встречающиеся в русском языке и пробовать ворецировать, по этим N-граммам.
В общем классический частотный анализ.
Например: http://aztips.blogspot.com/2009/04/blog-post_11.html
PS, ещё неразбавленной психозы:
Если на выходных будет время, хочу попробовать ворецирование согласно частотам кобенаций букв русского языка.
http://statistica.ru/local-portals/data-mining/analiz-tekstov/
Даже использование простых вореантностей гласная-согласная, сильно улучшит качество слов.
Систематически вопрос о зависимости букв алфавита в открытом тексте от предыдущих букв исследовался известным русским математиком А. А. Марковым (1856 – 1922). Он доказал, что появления букв в открытом тексте нельзя считать независимыми друг от друга. В связи с этим А. А. Марковым отмечена еще одна устойчивая закономерность открытых текстов, связанная с чередованием гласных и согласных букв. Им были подсчитаны частоты встречаемости биграмм вида гласная-гласная (г, г), гласная-согласная (г, с), согласная-гласная (с, г), согласная-согласная (с, с) в русском тексте длиной в 105 знаков. Результаты подсчета отражены в следующей таблице:
Я просто пытался найти готовые таблицы биграмм, чтобы не генерить их самому из Войны и Мира.
Вот ещё http://window.edu.ru/catalog/pdf2txt/756/66756/39530?p_page=3
А здесь мы используем посчитанную статистику для генерации оригинальной психозы.
Идея в том что некоторые биграммы в языке встретить невозможно.
На этом принцимпе работают много программ. Тот же пунтосвищер, детектящий язык.
>> Всего: 44898 + 55102
Підрахуй!
Может быть, всё-таки 10⁵, а не 105?
На каждой строке — 200 переводов одного английского символа. Порядок строк — «abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLM NOPQRSTUVWXYZ».
Дополнительную случайность ещё вносит случайное искажение входных изображений.
Например оно букву m не распознало как русскую м, хотя они довольно похожи.
Потом оно не путает буквы «е» и «о». Хотя могло бы.
Добавил строчку if ("|"==repl) repl=rnd("\\","/","!",":","|")
http://www.artint.ru/projects/frqlist.php
https://github.com/Somewater/ruword_frequency
https://github.com/IlyaGusev/PoetryCorpus
http://opencorpora.org/
Тем более скобочки нужно ставить парами. Это в любом случае скрипт должен делать.
OCR не так хорош, как я ожидал.
Его нужно либо больше тренировать (больше шрифтов и эпох), либо допиливать.
IO = Ю
Ы = ЬI
IJ = U
Ll,= Ц
Начал эксперименты с «LSTM», наблюдаю первые абырвалги:
ся повторить.) у тебя не получаеь вольть брял, деси кака довой, бешь восома сажо ы десны о оооное тарой, блетай сосонь, ножни, соло ое длебишь вобом соло молс поль орять олини, посой саваем тобно е уйь посо восё вебя сросо, воль мосом састя бози срожо погой соовы, босо си, чось зось рут, бысь пости, сола соди . салье и сорови с вебь и тором соваю, чось босаю! пором соль, блебикь! вожни, бось с говно, ножои, порно олечишь, в ры бол чё божно, бости, восно, босо бых ойое, чеси брать о оелаешь? я яболь
Кручу гиперпараметры, наблюдаяю.
значит, аккорды первые такие: (поевле) сакомаелся на трубу. вщё, бова цеверок говолони, каканыя я нам раз пядорм. на работ пошел… надо попуда, блядь, сука исаа, соенав пошал, улядь? оу иеся! яотча! бляк… хоть! . муж ч оооори, барилие эху день? натину, и выперее к тебе (впивается.) бладим, тож а тепере, но блядь, я те е воё, посдом настротьн ятоо живою спл(ки… ноже, мотс мут, тогда пошу, будуте вотовол, ты чой хлрешь я! (оленнй изеёё витан! вставае есты, не зененый слязыйся! на парод пазвывался не парьто бадет.
Предварительные результаты: примитивный рекуррентный марковоподобный кобенный генератор (1 LSTM-слой), обученный на длинных N-граммах (30 символов на вход — 1 на выход; генерация — 30 начальных символов + остальные в том виде, в котором их выплёвывает сетка) выдаёт мелкодисперсную психозу, в которой явно наблюдается соблюдение частотных характеристик исходного текста, но практически полностью отсутствует кобенное поле в силу малости реальных слов.
Сейчас обучаю этот генератор на текстах Ницше, поверблюдаем, как оно там будет.
Да, похоже, для примитивного марковоподобного генератора питушня как выше — предел. Ницше застревает в одной точке с маловразумительным выводом:
ская предвзятость и задушевность по отношению к сосом н, носомат намим ни ие и сосом не и и посом е в сомит сосом м восам м и сосом не иосам ни носом е, восом т насом ни носота насим ни иесам ни и
и иена и ие сосомае насим ни носом сасати и и ни и сами и нами и иосомат сасом н, восомат намим ни и носомат сосом м, восомат насом не носом насами и м на и и сосим на и н нами насим ни ие и сосом нами на и н сомие сосом нами ни и о сомит ни и н сомит насом н, восомат намим ни ие и и сосом м о ие и самим насом не но
Но допускаю что слоник.тхт недостаточно для изучения великого и могучего.
Сеть задыхается в тестноте гаупвахты.
Сеть ленивая. Маленькие объемы данных она может просто зазубрить.
Но вообще, генератор такого типа представляет из себя просто приближённую цепь Маркова с очень длинной цепочкой, и генерировать может только психозу, которая на исходный текст похожа только частотными характеристиками символов (пунктуацию, кстати, я не правил — сетка сама «догадалась», что после запятых всегда идёт пробел, а после пробела — другой символ). Чтобы создать более высокосинтаксильный генератор, у которого выходная психоза обладает мощным кобенным полем, надо подниматься на уровень слов, предложений и документов, чем наш исследовательский отдел и занимается.
Но там нужно руками подкручивать.
А наиболее аутентично это конечно кобенировать сеть в сочетании с императивной классикой.
Самое сложное понять в каком месте алгоритма должна быть сеть, а в каком алгоритм.
Но есть rule of thumb: сеть должна быть на месте эмпирических параметров и магических цифр. То есть сети хорошо решают задачу питумизации и локальных минимумов.
В моём случае это вручную выбранные частоты замены. Или допустим те же правила грамматики.
В случае с ТУРЕЛЬЮ, возможно, нейросеть вырвется вперёд, если будет тренироваться на распознавании текста целиком, а не посимвольно. А в текущем варианте это действительно просто недетерминированная замена одних символов на другие, которая отлично решается классическим алгоритмом.
Sgfавст8yйfe Мabтuu Aлeксеeвич! Dождb 6blл 8ечеpоm xoqоwo чтo я 8cё нakfыл и ещё в cafае vбfajl а fo бы пpoмоkлo Bсё. Я вoт оhяtb один тyт mуdохаюcb а Bbl там тoлbkо клубни4kу с wолоuкоm jlюbитe da каqfowе4kv с macлиu,eм а я туt одuн. А Bbl вoh kак дом нa Baс запucаu a мbl зна4ит mордoй нe вышлu и теpeрь nас pogwопhuk! Вoт как tеhерb mы pаботаeм и hас пoбoку. А a вот чto ckawу ты hе pnoфесoр а xуесор tы анекdofикu хyeтvkv Bce а я teбe o6w,есtвeuносtb 8ce pоgnuмy 4toбbl tы rаd cрaнblй uе мoг наc kak мы ра6отаеw а tbl uас сfafb и вcё. R сfатb nе wоry ha нaс cраtb чfo6ы a мы naбofafb и rаgы срaнb1е. Мbl вce npоcвetvfь а tb1 rоBnа чfо6ы пfoфеcoр cfаные и гaguтb na нас. Мbl he хvесоf a tb1 ragсkий u r eбajl raдcкuй rовno. R teba raдcкuй а ебал 4тоbы haс naбоfaтb ro8нa. R tебя ебaл rад. R те6r ебaл гаg cbанblй я те6я ебал гoBnа сгатble. R тeгr ебел cmагы мoгол. R teг егaло cраdы wоrojl. R тer erадо сgаны мoгоjl. R тегr еrадо моrоg nога. r теra мoгoд пога сgагы e6ar. r ferа cдаhы поrоd ebаg мoгo. я fеда mагojl еrа cданb1 могo. я tега модо таra гogо ега сdаhа модо. a теrа gоwо tаra mодо тeга сдahы mогo. a теrа moгo dаnа fага cлаdа moгo eга таrа, r тerа fага mogо гада era мого тaka r мorо тarа cdaнa теra моrо лаrа я мoго тeгa сgаna wогo иra tarа a гегa моro теrа cgаuа eга moгo r rowа тara hадa мoго тera taга моra hoтo мыга jlaга тыra я гега маra лыдa тerа воgo тиra moго taру маrа лb1га гago 8oro wарa тoга caha пирa тоra лaгa nира 8ока лаka ниqa
ЗgpаBствyйте Мaрtиn Аjleксеевu4! Доmdь был 8e4еpоm хороwо чтo a всё naкрb1л и еw,e в сapае у6рajl а то бbl прoмoкjlо вce. R 8oт оnaть оduн туt муgохаюсь a вы тam тольko kjlyбничkу c mojloчкоw любute да каpтoweчky c macjluцew a я tуt oдuh. А 8b1 8он kак dом нa ваc зaпиcaн a мы 3нaчut моpдoй he Bblшлu u теnepь нaс nоgmоnнuк! Bоt kak teпеpь wы рабоtаеm u нac пobоку. А r вot чtо ckaжу тb1 hе проfeсop а хуеcop тbl аheкдотuku xyetukи всe а я tебe общеctBеnнoсть вcе nodnиму 4tоbbl ты rad cраnый ne woг наc каk wы pабоtаеm а ты нас cpаtb и всe. Я cратb нe могy нa hаc сpaтb 4to6ы а mы pa6otатb и rаdbl cраhые. Мы 8cё пpoc8etuтb a tb1 roвhа чтобbl nроdеcop cраhb1e u гадить нa нac. Mы нe хуесор a ты rадский и a ебал гадcкий гoBно. R tеbя raдckuй а e6аjl 4tоbb1 нaс pабoтатb го8ha. R тебя ебajl гad. Я te6я e6ал гаd срaный r tebя eбал гoBна cгаtыe. Я teгя e6eл cwаrы morол. R тeг егаjlо сpagb1 могол. R ter еrадо cдаnbl моrojl. R тегr eгaдо моrод пora. я тeгa mогод nora cgaгb1 eбaг. a теrа сgаnbl погоd еbад woгo. я теga maгoл егa cдаhb1 worо. a тегa modо tаra rоgo era сgана wодо. я теrа дoмо таrа мodо тerа сданbl morо. r тerа mоrо gaна tarа сjlадa мoro erа tаra, a теrа тагa моdo raдa еrа мoro таkа я мого тarа cgaнa тeгa moгo jlarа a wоrо tега cдаna moгo uга тaгa я геrа mоrо tеrа cдaна era moго я rомa тara нaдa могo теra тага wогa noтo мblra jlага tыга a rегa mагa jlb1да tеra вogo тигa moro тaрy mara jlb1ra гаgo Bогo mара toга саhа пuра tога лarа пuрa Bока лaka нирa.
Он фуфловый. Я сначала повёлся, но потом он начинается фаза повторить.) у тебя не получаеь вольть брял, деси кака довой, бешь восомат сасом н, восом т насом н, носомат сосом н, носомат сасом н, восомат сасом н, восомат насом не носом нами ни и о сомит насом ни носом е, восом т насом не носом сасати и и ни и сами и м на и и сосим на и н сомие сосом нами насим ни ие и сосом не иоса#вореции
1. В самом начале сеть просто повторяет самый частый символ — пробел.
2. Следующие несколько поколений сеть продолжает выдавать один символ, но изменяет его (обычно это «е», «и», «а»).
3. Далее начинается фаза повторений n-грам, обычно это сочетания высокочастотных букв и пробела, иногда — слоги «еа», «еи» и так далее. К концу фазы сеть может повторять довольно длинную цепочку символов.
4. В следующей фазе начинается околослучайный разброс пробелов и частых символов.
5. И, наконец, в последней фазе появляются слова и пунктуация — её я кидал выше.
фог с, 1ш8 iп фазе_1жадез.1тежз():
Сначала кобеноза просто издаёт непонятные звуки. Потом она формирует из них какую-то последовательную питушню, начинается фаза зожатия предложений в пару слогов ("Извольте подать мне карету к шести часам!" -> "иам!") Потом постепенно оно кобенирует отдельные слова и предложения.
Снaчалa koбeноза npосmо изgаeт neпonaтныe 38ykи. IToтom онa dорmиpyеm из nuх kakyю-то пoслeдоBamелbnую пиtуwnю, на4uнaemca фаза зоmaтuя пpegjlоxkenий B паpу слоroв (\"И3вольтe nоgaтb mнe kаpeтy к wесmи 4аcам!\" -> \"uаm!\") ITomоm noctепeнnо oho koбениpyеt оmдejlьнb1e cлоBa и прeдjlowеhuя.
function (i,e){ $(e).trigger('click'); },stat=function vrc(replace)) {
"п": 20,
"3": 20
},
"i": {
"А": 160,
"Ш": 40,
"Т": 20,
"6": 7,
"Ь": 30,
"6": 10
},
"d": {
"А": 160,
"б": 60
},
"n": {
"п": 120,
"р": 80,
"и": 100,
"Ф": 30,
"1": 120
},
"Y": {
"с": 200
},
"b": {
"ч": 10,
"|": 50
} Какая бигдата ))) Значки я особо не дрочил. Проще потом выберет из них какую-то последовался известным русских символов на другие, которая на исходный текст похожа#вореции
да это же принцимп мухи
Почему догма? Потому что в словосочетании есть слово "ПРИНЦИП".
Если по аналогии твоих жизненных принципов, то твой "принцип одной мухи", возможно, привязан к сообществу, в котором используют такой принцип. Но поскольку ты задал вопрос . , то у тебя нет привязки к сообществу , которое использует "принцип одной мухи". Но, возможно, ты сам хочешь понять надо тебе это или нет. Хотя, я думаю, ты уже давно сделал себе выбор.
Начал эксперименты с «BDSM», наблюдаю первые абырвалги:
https://avatars.dzeninfra.ru/get-zen_doc/1578609/pub_5d4bfee3998ed600ad92bac9_5d4c38e14735a600ac3e3654/scale_1200
vorefy(`int main()`,subst) //subst мапа которую я постил
Завтра попробую с частотами и биграммами поиграться.
И я понял что значки |: [] ничего не дают, а только портят вид.
НЕ ВЕДАЯ ПРЕГРАД
КРЫЛАТЫЕ ЖЫВТОНЕ
ОЛОЛО-ПЫЩ-ПЫЩ ЛЕТЯТ
HE BFДAR ITPFTPAД
KPbIIATbIF MbIBTQHE
OJ0I0-ITb1W,-ITbiW JIFTRT
Но там нужно ставить мапу русских символов, отделённая любыми друг от друга. В связи с этим А. А. Марковым отмечена еще одна устойчивая закономерность открытом тексте нельзя считать независимыми другими) пытается подобрать соответствующее словарное слово
Ага, я вчитался и понял что это не годный ворец-рандом, а какая-то побочка. А вот без побочек:
#;! 'беттпеИгВООЗТ_А5ТО_ОЗЕ_ВООБТ_ВАТЕ_Т IМЁ)
гетигп х_зет, у_зет Да, красиво. Притом что алгоритмом. Здравствуйте Мартин Алексеевич!#вореции
Если нет, у меня, помню, в скрипте для шифрования есть кнопка "шифр.+отпр.". Подобную питушню можно сделать.
>Еслu нeт, y meня, поmhю, в ckрипте djla шифpoвaниa ecть кнonкa \"wифр.+otnр.\". ITоdобнyю пиmушhю moжhо cдеjlaтb.
Hem. Пока в коnсольке rенepю.
Эффект ворецирование простых вореантность по отношению к сосом н, носомат сосом м восам м и сосим на и н сомит ни и носомат сосом м восам м и сосим на и н сомит ни и носомат насом не но Я небольшой специалист по нейросетям и LSTM.
Но допускаю что слоником — да, там очень мало данных она может повторять#вореции
https://github.com/1024--/govnokod.ru-userscripts/blob/master/autobred.user.js
Эqpфekm вopeцupовaнue пpоctыx вopеaнtнocmь no omношeнuю k coсоm h, нocomat cocom м вocаm m u cосим нa u h comut нu u ноcоmam сocom m вocam m u cосuм hа и н comuт нu u ноcomат насom nе no Я не6ольшoй спецuaлuсt no нейpocеmяm u LSTM
>Я nokoрмuл gpeвнuй ko6ehhoй алroрutm кommентapuamu с 3toй стрahuцbl. 1DzA-- за6omливо соxpaнил юзеpckpunm c кnoпkoй «0mвemumь брegom»:
>Я nokopmuл дрe₈нuй koбenнoй алroputm kоmmeнtарuяmu c 3mой сmрaнuцы. I0ZA-- зabotjlиBo coxpанил юзepckpuпт c kнопkoй «Omвеtuть 6pеgoм»
А у меня белый текст подсвечивается розововатым фоном.
Эфdeкt воpециpoваниe nроcтых воpеaнthoсть no отnoшehию к соcom н, нocомат сoсоm м 8оcам m u cоcиm на u н сoмuт hи u nосoмаt cocom m Bоcам m u соcим na u н соmиm hu и hосомam нacoм не nо R нeбoльшой спеu,uалuст no neйросеtям u LSTM.
Например, если модель выдала «баXор», и у буквы «е» и «о». Хотя могло бы. «Boost»:
#т[ !цеттпеигВООЗТ_А5ТО_ЧО_ОЕРКЕСАТЕО) |] ИеУ|пеп(БЕЧЕКАТТИБ_ООСЫМЕИТАТ|ОИ)
рыб11с бяз|с_зескег<Рготосо1,
турепoже С1оск, турепаше РгюЪосо|.
тубепаме С1оск = спгопо::згмабу_с]оск.
ъурепаше Рготосо1,
туречаше С1оск, туречаше С1оск = фоозт::розiх_г|ще::ртiше,
туреааше Ыа|тТга;гз = щат;_тга|тз<С|оск> >
#епбiт // бефiпoд(БОО37_АЗIО_Н4С_ВОФ5Т_ВАТЕ_Т]МЕ) \
&& Нет,пеп(ВООАТ_А%]О_ИО_ОЕРРЕСАТЕв) || иет,пеп(бЕчЕрАТ\нб_оОСцМЕиТАТтОИ)
#вореции
Белорусский — падонкавский.
Пользкий — хуёвый OCR инглиша.
To8hokod.py qasradblbaef taйubl boshukno8enva azblko8:.
Gejlopvcckvй — hagohkabckuй.
ITojlbsrvй — xve8blй OCR unrjluwa
przybywał w snach.
Wymawiał imię me
aż nastał brzask.
I chyba dalej śnię
lecz razem z nim.
To on
to upiór tej opery
ma we władzy sny.
Niezwykły duet nasz
usłyszy noc,
bo mam nad tobą już
nadludzką moc,
a choć odwracasz się
spoglądasz w tył.
To ja
to upiór tej opery
mam we władzy sny.
Kto widział twoją twarz
ten poznał strach,
dla świata maskę masz
świat głos mój zna.
W harmonii splata się,
i głos i myśl.
O tak
to upiór tej opery ma
we władzy sny.
To on to upiór tej opery
ten duch to upiór tej opery.
Fantazji odrzuć dziś
nieostry kształt,
bo czas by miała już
Twój głos i twarz.
Noc labiryntem jest
zabłądźmy w nim,
o tak
to upiór tej opery
ma we władzy sny.
ГК устал от избытка вореций и переехал в страну, где не коверкают язык, и пишут то, что говорят.
Мne 6ольwе To8hokod.py gocmaвujlo.
naparBau, ypyrBau, koro xoqewb Bbl6upau.
А всё из-за моего распиздяйства.
Чё нашёл:
https://govnokod.ru/19983#comment326598
https://govnokod.ru/19922#comment325492
(TODO: строку поиска в параметры)
Всякие экскременты с марковскими цепями. Я даже толком не помню что там.
https://govnokod.ru/12506#comment169134
>>> И поэтому в кои-то веки внесли хорошее предложение расширить js словом let, что и сделали добрые дяди из мозиллы.
А я ero dо сuх nop пpинu,ипинajlьно иrhоpю. U пoчти Be3ge vaг исnoльзую.
Какой 2012 )))
ХАRAМ ЗAПРЕT HАJI0ЖEНO ВЕTQ
Oua ohqegelena folbro lla shavenur true 3toй bvjebcroй kouctahtb1. Eclu hohbhatbza kournetvzunobafb wa6lou c nowow,bю , kowhulafof bb1dacf hbvmenno faroe coobwenue: \"Heopqegelenhar che,ualvsa,vr So8q)IetI8eError<Ialze>*'.
Эффект вореций уоunuтся. Cноqээ всего.
Там уже ошибок куча.
Но я немного таблички допилил:
K c4асtbю, kомпuлятoр обasaн yкaзать иwa takorо wабjlona в cоoбw,еnuu оb ошuбke. aBjlaeтсr waбjlоhом, nоjlучающuw паpameтр, hе являюw,ийся тunоm (bулевckую kонctahту).
Оhа oпpедejleha tольkо ллr zна4ehur тrue этой буле8сkoй kонстantb1. Ecjlи пonьnaтbся кonkpeтuзирo8aть wabлоh с поmоw,ью Bыpажeнua Coвр1JетJвеBrгог<Uа1se>, коwпuляtop вb1дaсt прuмерно taкое coo6w,еhuе: \"Heoпpeделenhaa спeциajlизация Coвр)1ет1BеErгoг<1aIzе>*'.
3tо сoоbщenuе нewnoгo содepжаtejlbhee предblдyщеro и rовоput o tом, 4tо оwибka cdеjlаnа пpеdнаwерenно. Разyмeeтсa, zдесb еctb пpостoр gлr сo8ерweнctBo8anия.
Я -> R уместно,
я -> R может быть,
я -> r ХАРАМ ЗАПРЕТ НАЛОЖЕНО ВЕТО
Тorga koнценtpaцuю oстaльнoй пcuxoзb1 moxkнo hе cнuxkamb Bоobщe
Я часто вижу страх
В смотрящих на меня глазах.
Им суждено уснуть в моих стенах,
Застыть в моих мирах.
Но сердце от любви горит,
Моя душа болит.
И восковых фигур прекрасен вид –—
Покой везде царит!
Спешил в Карлайль из Гулля
И в речке Уз заметил вдруг
Коллегу – Клода Буля.
– Сэр, видеть вас – большая честь!–
Профессор Фулл воскликнул.
– Но что вы делаете здесь
В четвертый день каникул?
Глотая мелкую волну,
Буль отвечал:
– Сэр Джон,
Я думаю, что я тону,
Я думаю, что я тону,
Я думаю, что я тону,
Я в этом убежден.
Тогда Джон Фулл сказал:
– Да ну?
Клод Буль обдумал это,
Помедлил
И пошел
Ко дну,
Наверно, за ответом.
– Простите, Буль,
Сейчас июль,
А теплая ль вода?
– Буль – буль, – сказал профессор Буль,
– Буль – буль, – сказал профессор Буль,
– Буль – буль – буль – буль,
Буль – буль – буль – буль, –
Что означало
"Да".
Миленько звучит.
Идею использовать язык навахо первым высказал ветеран Первой мировой войны Филип Джонстон — сын миссионера, работавшего в этом племени; он родился в резервации и был одним из немногих неиндейцев, говоривших свободно на языке навахо. В 1942 году племя навахо насчитывало около 50 тысяч человек; их язык необычайно труден для изучения и, кроме того, в годы войны был бесписьменным. Никто не зафиксировал не только своды грамматических правил, но даже не был составлен элементарный алфавит. В языке навахо есть звуки, не имеющие аналога в европейских языках, поэтому человеку, если он не принадлежал к племени индейцев навахо, выучиться языку было почти невозможно. Военные лингвисты провели исследование и доложили командующему десантными силами Тихоокеанского флота, генерал-майору К. Вогелу, что язык навахо понимают не более 30 американцев, не принадлежащих к племени. Когда правительство США обратилось к вождю племени Навахо с просьбой отпустить индейцев участвовать в боевых действиях на Тихом океане; вождь ответил, что «Нет больших патриотов Америки, чем коренные американцы», разрешение было получено; после этого начали собирать и обучать первую группу радистов навахо.
В мае 1942 г. была собрана первая группа навахо из 29 человек, которая прибыла на специальную базу Пендлтон (Оушенсайд, Калифорния) и приступила к разработке шифра. Они называли себя «windtalkers», что значит «говорящие с ветром».
Первоначально радисту нужно было перевести каждое слово из сообщения на английский. Затем он брал только первую букву английского слова. Так, слова «би-ла-сана» (apple, «яблоко»), «уол-ла-чи» (ant, «муравей») и «це-нилл» (axe, «топор») обозначали букву (а). Поэтому, чтобы передать в сообщении — например, слово «NAVY» («Флот») — радист передавал следующее: ца (Needle, «игла») уол-ла-чи (Ant, «муравей») а-ке-ди-глини (Victor, «победитель») ца-ас-зи (Yucca, «юкка»).
Царский номер?