Posts Tagged ‘多语言

主题(Silky Blue 1.0)汉化

2009年06月10日 星期三

花了接近一个小时, 终于把这款主题(Silky Blue 1.0)汉化完成. 部分文字直接翻译, 部分文字使用多语言资源串. 很久没有接触PHP了, 权当复习一下.

温故而知新 vs 重复劳动.

多语言网站解决方案

2009年01月20日 星期二

前言:
多语言网站开发,重点的还是在解决语言之间的问题。
那如何解决这个问题呢?大概就分三步走:

1.页面多语言
2.数据库多语言
3.用户访问语言统一

1.页面多语言
需要考虑的问题:
A.用户登陆时候,自动识别字符,调用不同的语言包?
B.用户切换不同语言时候,调用不同的语言包?
C.增加多语言后的目录结构?

页面多语言也就是外观的多语言化,这里可以采用静态的语言包的方式。
设计时候就应该包括language的目录,针对不同语言有独立的子目录。
如英文language/en ,简体中文language/gb,繁体中文language/b5 (可以扩展其他语言)
每个目录下就包含了对每个页面的语言版本。选择语言版本时候就可以调用相应版本的语言包。

具体做法:
0.利用js语言,识别浏览器语言,在调用不同的语言包.

1.language/en/global.ln是针对英文版的全局语言包。

2.global.ln 内容为:
$title = “English webstie”;
$charset = “UTF-8″;

3.index.php调用:
< ?php
require_once()
?>
r /> <meta http-equiv=”content-type” content=”text/html;charset=$charset”><br /> </meta>

这样通过扩展就可以实现页面的多语言化.

2.数据库多语言
这个考虑的问题:
A.后台录入数据的多语言化?
B.用户在不同版本下,提交的内容,如何保存?
C.提供三种语言包,还是提供英文和简体,简体通过转化提供繁体?

数据库多语言就是达到多语言在数据库里面的统一。就需要采用utf-8统一编码。
无论什么语言的文字,都统一使用utf-8来存放到数据库里面。采用表字段来表识
属于什么语言版本的文字。

具体:

A.对于后台添加的问题:

1.后台添加时候,就需要多语言化的录入。先建立一个以utf-8编码的数据库,录入英文/简体,简体在通过转化为繁体,
再以utf-8编码方式存于数据库中。

2.建立以utf-8为编码的表结构,importlanguage标识属于什么语言版本
但在某个版本下,就搜索属于这个版本的文字来显示。其他文字不显示。
DROP TABLE IF EXISTS `zz_importer`;
CREATE TABLE IF NOT EXISTS `zz_importer` (
`importID` int(11) NOT NULL auto_increment,
`importTime` date NOT NULL default ‘0000-00-00′,
`improtfile` varchar(100) NOT NULL default ”,
`importlanguage` varchar(100) NOT NULL default ”
PRIMARY KEY (`importID`)
) ENGINE=MyISAM DEFAULT CHARSET=uft-8;

3.简体转化的繁体。
利用php的iconv.此过程对于linux/unix有效,对于windows无效。
iconv(“GB2312″,”BIG5″,$text);

4.因为,charset = “utf-8″,数据就都是以utf-8编码方式存在,
添加数据时候,要分别用en/gb/big5来标识语言版本.
INSERT INTO `zz_importer` VALUES (,”, ”, ‘en’);
INSERT INTO `zz_importer` VALUES (,”, ”, ‘gb’);
INSERT INTO `zz_importer` VALUES (,”, ”, ‘big5′);

B.对于用户添加的问题:
1.假设下简体中文下.用户因为页面头为UTF-8.则用户浏览器会以utf-8编码
方式浏览页面。

2.添加的数据库本身以utf-8方式存在。

3.添加数据时候,要分别用gb来标识语言版本
INSERT INTO `zz_importer` VALUES (,”, ”, ‘gb’);

C.对于简体和繁体是单独提供还是转化问题

单独提供 – 比较符合多语言的标准,灵活性大,对ISP没有特别的要求。

转化提供 – 提交速度会受影响,同时要ISP提供iconv的函数支持。

3.用户访问语言统一

A.假设用户简体中文版时候:

所有语言版本都是这样。

B.调用language/gb的语言包。

C.搜索数据库有语言字段为gb的数据,并显示

D.当用户提交信息,参照上面数据库多语言的B问题。

数据库存放可以有几种方式的:

A.不同数据库来存放
B.同一数据库不同表存放
C.同一数据库同一表不同字段来存放

A.种方式,每种语言都建立一个数据库感觉就有点浪费了。

B种方式可能是比较多人采用的。基本是共有的就建立一个表来存放。
每种语言私有的,就放到各自的表里面。

C种方式,感觉对于数据量不大的,也是好的方式。
数据量太大,给单表的增大更快。造成负担。

来源: http://www.phpwind.net/simple/t84546.html

Going Global With Text

2008年03月12日 星期三

A number of issues related to internationalization of the software:

* International issues can be divided into four groups: native language rules, character sets, I/O formatting, and message translation.
* C++ has broad support for character sets, imposing few minimum requirements.
* At compile time, C++ reads files in the physical character set, and converts the characters to the source character set.
* At runtime, C++ interprets characters according to the execution character set.
* The execution character set comes in two flavors: narrow and wide.
* Narrow characters use the char type. Wide characters use the wchar_t type.
* You have no control over the execution character set. You can only hope that it is a Unicode encoding (UTF-8 for narrow and UTF-32 for wide).
* C++ does not mandate Unicode character sets, but you can specify Unicode code points as universal character names: \uXXXX or \UXXXXXXXX.
* C++ imposes few requirements on wchar_t, but the ideal implementation is a 32-bit value and UTF-32 encoding.
* A multibyte character set uses a sequence of narrow characters to represent a single logical character.
* Multibyte character sets are useful only for converting to and from wide characters.
* Case conversion is hard to do correctly one character at a time. Much better is to convert an entire string at a time. C++ does it one character at a time.
* A locale specifies I/O formatting rules (among other things).
* I/O formatting rules include: thousands separator, decimal point, and the format of negative numbers. I/O streams automatically use the formatting rules of its locale.
* The initial locale is the classic or “C” locale, which implements universally portable formatting rules.
* The user’s preferences are expressed in the default locale, which is locale(“”).
* Other named locales are possible, but the C++ standard does not dictate naming rules.
* Each I/O stream can have a distinct locale. Associating a locale with a stream is called imbuing the stream with the locale.
* Many applications use std::locale only to imbue streams or set the global locale.

Link: http://cpphelp.com/learning/ch08-global.html