The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Сменить кодировку на UTF-8 во всех файлах сайта."
Вариант для распечатки  
Пред. тема | След. тема 
Форумы WEB технологии (Public)
Изначальное сообщение [ Отслеживать ]

"Сменить кодировку на UTF-8 во всех файлах сайта."  
Сообщение от Alex email(??) on 27-Ноя-08, 02:46 
Всем привет! Есть сайт (весь контент - около 4 ГБ) на CP1251.
Как перекодировать все скрипты и HTML в UTF-8 без BOM? Есть SSH на арендованном сервере с su.

Чувствую, что нужно копать в сторону find + iconv. Пока не получается.

Спасибо заранее!

Высказать мнение | Ответить | Правка | Cообщить модератору

 Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Сменить кодировку на UTF-8 во всех файлах сайта."  
Сообщение от Alabama (??) on 27-Ноя-08, 04:32 
#/bin/sh
dir=.

for i in $dir/*
            do
                if [ -f $i ]
                  then
                      cp $i $i.utf
                      iconv -f cp1251 -t utf-8 $i -o $i.utf
                      mv $i.utf $i
                fi
            done

меняет в текущей

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

2. "Сменить кодировку на UTF-8 во всех файлах сайта."  
Сообщение от angra (ok) on 27-Ноя-08, 09:11 
И спотыкается на первом же файле с пробелами, а в некоторых случаях даже портит файлы. Переменные желательно брать в двойные кавычки.
Вообще неплохо было бы начать с поиска готовой утилиты в дистре. Если нет то man find на предмет exec или man xargs.
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

3. "Сменить кодировку на UTF-8 во всех файлах сайта."  
Сообщение от Pahanivo email(ok) on 28-Ноя-08, 15:00 
>Всем привет! Есть сайт (весь контент - около 4 ГБ) на CP1251.
>
>Как перекодировать все скрипты и HTML в UTF-8 без BOM? Есть SSH
>на арендованном сервере с su.
>
>Чувствую, что нужно копать в сторону find + iconv. Пока не получается.
>
>
>Спасибо заранее!

Ага для начала научится выдергивать find список файлов, причем учеть файло с пробелами и начинающиеся с точки (.htaccess). Find по дефолту точко-файлы не ищет.
Затем xargs или как то по другом подсовывать в качестве параметра iconv (насчет iconv не уверен, особо не ковырял).

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

4. "Сменить кодировку на UTF-8 во всех файлах сайта."  
Сообщение от posix (ok) on 04-Фев-09, 15:30 
>Всем привет! Есть сайт (весь контент - около 4 ГБ) на CP1251.
>
>Как перекодировать все скрипты и HTML в UTF-8 без BOM? Есть SSH
>на арендованном сервере с su.
>
>Чувствую, что нужно копать в сторону find + iconv. Пока не получается.
>
>
>Спасибо заранее!

for x in *.HTML; do cat $x |iconv -f cp1251 -t utf-8 > `echo $x | tr [A-Z] [a-z]`;wait; done

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

5. "Сменить кодировку на UTF-8 во всех файлах сайта."  
Сообщение от angra (ok) on 05-Фев-09, 02:16 
Молодец, мало того, что ответил на сообщение двух месячной давности, так еще и в ответе нюбские ошибки. Поздравляю с обретением звания некрофил-недоучка.
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Оцените тред (1=ужас, 5=супер)? [ 1 | 2 | 3 | 4 | 5 ] [Рекомендовать для помещения в FAQ]




Спонсоры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2022 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру