dd/d12/strgen__base_8cpp_source.html

/*

 * This file is part of OpenTTD.

 * OpenTTD is free software; you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation, version 2.

 * OpenTTD is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

 * See the GNU General Public License for more details. You should have received a copy of the GNU General Public License along with OpenTTD. If not, see <http://www.gnu.org/licenses/>.

 */


#include "../stdafx.h"

#include "../core/endian_func.hpp"

#include "../core/math_func.hpp"

#include "../error_func.h"

#include "../string_func.h"

#include "../core/string_builder.hpp"

#include "../table/control_codes.h"


#include "strgen.h"


#include "../table/strgen_tables.h"


#include "../safeguards.h"


StrgenState _strgen;

static bool _translated;

static std::string_view _cur_ident;

static ParsedCommandStruct _cur_pcs;

static size_t _cur_argidx;


struct ParsedCommandString {

  const CmdStruct *cmd = nullptr;

  std::string param;

  std::optional<size_t> argno;

  std::optional<uint8_t> casei;

};

struct ParsedCommandString {…};

static ParsedCommandString ParseCommandString(StringConsumer &consumer);

static size_t TranslateArgumentIdx(size_t arg, size_t offset = 0);


Case::Case(uint8_t caseidx, std::string_view string) :

    caseidx(caseidx), string(string)

{

}

Case::Case(uint8_t caseidx, std::string_view string) : {…}


LangString::LangString(std::string_view name, std::string_view english, size_t index, size_t line) :

    name(name), english(english), index(index), line(line)

{

}

LangString::LangString(std::string_view name, std::string_view english, size_t index, size_t line) : {…}


void LangString::FreeTranslation()

{

  this->translated.clear();

  this->translated_cases.clear();

}

void LangString::FreeTranslation() {…}


StringData::StringData(size_t tabs) : tabs(tabs), max_strings(tabs * TAB_SIZE)

{

  this->strings.resize(max_strings);

  this->next_string_id = 0;

}

StringData::StringData(size_t tabs) : tabs(tabs), max_strings(tabs * TAB_SIZE) {…}


void StringData::FreeTranslation()

{

  for (size_t i = 0; i < this->max_strings; i++) {

    LangString *ls = this->strings[i].get();

    if (ls != nullptr) ls->FreeTranslation();

  }

}

void StringData::FreeTranslation() {…}


void StringData::Add(std::shared_ptr<LangString> ls)

{

  this->name_to_string[ls->name] = ls;

  this->strings[ls->index] = std::move(ls);

}

void StringData::Add(std::shared_ptr<LangString> ls) {…}


LangString *StringData::Find(std::string_view s)

{

  auto it = this->name_to_string.find(s);

  if (it == this->name_to_string.end()) return nullptr;


  return it->second.get();

}

LangString *StringData::Find(std::string_view s) {…}


static uint32_t VersionHashStr(uint32_t hash, std::string_view s)

{

  for (auto c : s) {

    hash = std::rotl(hash, 3) ^ c;

    hash = (hash & 1 ? hash >> 1 ^ 0xDEADBEEF : hash >> 1);

  }

  return hash;

}

static uint32_t VersionHashStr(uint32_t hash, std::string_view s) {…}


uint32_t StringData::Version() const

{

  uint32_t hash = 0;


  for (size_t i = 0; i < this->max_strings; i++) {

    const LangString *ls = this->strings[i].get();


    if (ls != nullptr) {

      hash ^= i * 0x717239;

      hash = (hash & 1 ? hash >> 1 ^ 0xDEADBEEF : hash >> 1);

      hash = VersionHashStr(hash, ls->name);


      StringConsumer consumer(ls->english);

      ParsedCommandString cs;

      while ((cs = ParseCommandString(consumer)).cmd != nullptr) {

        if (cs.cmd->flags.Test(CmdFlag::DontCount)) continue;


        hash ^= (cs.cmd - _cmd_structs) * 0x1234567;

        hash = (hash & 1 ? hash >> 1 ^ 0xF00BAA4 : hash >> 1);

      }

    }

  }


  return hash;

}

uint32_t StringData::Version() const {…}


size_t StringData::CountInUse(size_t tab) const

{

  size_t count = TAB_SIZE;

  while (count > 0 && this->strings[(tab * TAB_SIZE) + count - 1] == nullptr) --count;

  return count;

}

size_t StringData::CountInUse(size_t tab) const {…}


void EmitSingleChar(StringBuilder &builder, std::string_view param, char32_t value)

{

  if (!param.empty()) StrgenWarning("Ignoring trailing letters in command");

  builder.PutUtf8(value);

}


/* The plural specifier looks like

 * {NUM} {PLURAL <ARG#> passenger passengers} then it picks either passenger/passengers depending on the count in NUM */

static std::pair<std::optional<size_t>, std::optional<size_t>> ParseRelNum(StringConsumer &consumer)

{

  consumer.SkipUntilCharNotIn(StringConsumer::WHITESPACE_NO_NEWLINE);

  std::optional<size_t> v = consumer.TryReadIntegerBase<size_t>(10);

  std::optional<size_t> offset;

  if (v.has_value() && consumer.ReadCharIf(':')) {

    /* Take the Nth within */

    offset = consumer.TryReadIntegerBase<size_t>(10);

    if (!offset.has_value()) StrgenFatal("Expected number for substring parameter");

  }

  return {v, offset};

}


/* Parse out the next word, or nullptr */

std::optional<std::string_view> ParseWord(StringConsumer &consumer)

{

  consumer.SkipUntilCharNotIn(StringConsumer::WHITESPACE_NO_NEWLINE);

  if (!consumer.AnyBytesLeft()) return {};


  if (consumer.ReadCharIf('"')) {

    /* parse until next " or NUL */

    auto result = consumer.ReadUntilChar('"', StringConsumer::KEEP_SEPARATOR);

    if (!consumer.ReadCharIf('"')) StrgenFatal("Unterminated quotes");

    return result;

  } else {

    /* proceed until whitespace or NUL */

    return consumer.ReadUntilCharIn(StringConsumer::WHITESPACE_NO_NEWLINE);

  }

}


/* This is encoded like

 *  CommandByte <ARG#> <NUM> {Length of each string} {each string} */

static void EmitWordList(StringBuilder &builder, const std::vector<std::string> &words)

{

  builder.PutUint8(static_cast<uint8_t>(words.size()));

  for (size_t i = 0; i < words.size(); i++) {

    size_t len = words[i].size();

    if (len > UINT8_MAX) StrgenFatal("WordList {}/{} string '{}' too long, max bytes {}", i + 1, words.size(), words[i], UINT8_MAX);

    builder.PutUint8(static_cast<uint8_t>(len));

  }

  for (size_t i = 0; i < words.size(); i++) {

    builder.Put(words[i]);

  }

}


void EmitPlural(StringBuilder &builder, std::string_view param, char32_t)

{

  StringConsumer consumer(param);


  /* Parse out the number, if one exists. Otherwise default to prev arg. */

  auto [argidx, offset] = ParseRelNum(consumer);

  if (!argidx.has_value()) {

    if (_cur_argidx == 0) StrgenFatal("Plural choice needs positional reference");

    argidx = _cur_argidx - 1;

  }


  const CmdStruct *cmd = _cur_pcs.consuming_commands[*argidx];

  if (!offset.has_value()) {

    /* Use default offset */

    if (cmd == nullptr || !cmd->default_plural_offset.has_value()) {

      StrgenFatal("Command '{}' has no (default) plural position", cmd == nullptr ? "<empty>" : cmd->cmd);

    }

    offset = cmd->default_plural_offset;

  }


  /* Parse each string */

  std::vector<std::string> words;

  for (;;) {

    auto word = ParseWord(consumer);

    if (!word.has_value()) break;

    words.emplace_back(*word);

  }


  if (words.empty()) {

    StrgenFatal("{}: No plural words", _cur_ident);

  }


  size_t expected = _plural_forms[_strgen.lang.plural_form].plural_count;

  if (expected != words.size()) {

    if (_translated) {

      StrgenFatal("{}: Invalid number of plural forms. Expecting {}, found {}.", _cur_ident,

        expected, words.size());

    } else {

      if (_strgen.show_warnings) StrgenWarning("'{}' is untranslated. Tweaking english string to allow compilation for plural forms", _cur_ident);

      if (words.size() > expected) {

        words.resize(expected);

      } else {

        while (words.size() < expected) {

          words.push_back(words.back());

        }

      }

    }

  }


  builder.PutUtf8(SCC_PLURAL_LIST);

  builder.PutUint8(_strgen.lang.plural_form);

  builder.PutUint8(static_cast<uint8_t>(TranslateArgumentIdx(*argidx, *offset)));

  EmitWordList(builder, words);

}


void EmitGender(StringBuilder &builder, std::string_view param, char32_t)

{

  StringConsumer consumer(param);

  if (consumer.ReadCharIf('=')) {

    /* This is a {G=DER} command */

    auto gender = consumer.Read(StringConsumer::npos);

    auto nw = _strgen.lang.GetGenderIndex(gender);

    if (nw >= MAX_NUM_GENDERS) StrgenFatal("G argument '{}' invalid", gender);


    /* now nw contains the gender index */

    builder.PutUtf8(SCC_GENDER_INDEX);

    builder.PutUint8(nw);

  } else {

    /* This is a {G 0 foo bar two} command.

     * If no relative number exists, default to +0 */

    auto [argidx, offset] = ParseRelNum(consumer);

    if (!argidx.has_value()) argidx = _cur_argidx;

    if (!offset.has_value()) offset = 0;


    const CmdStruct *cmd = _cur_pcs.consuming_commands[*argidx];

    if (cmd == nullptr || !cmd->flags.Test(CmdFlag::Gender)) {

      StrgenFatal("Command '{}' can't have a gender", cmd == nullptr ? "<empty>" : cmd->cmd);

    }


    std::vector<std::string> words;

    for (;;) {

      auto word = ParseWord(consumer);

      if (!word.has_value()) break;

      words.emplace_back(*word);

    }

    if (words.size() != _strgen.lang.num_genders) StrgenFatal("Bad # of arguments for gender command");


    assert(IsInsideBS(cmd->value, SCC_CONTROL_START, UINT8_MAX));

    builder.PutUtf8(SCC_GENDER_LIST);

    builder.PutUint8(static_cast<uint8_t>(TranslateArgumentIdx(*argidx, *offset)));

    EmitWordList(builder, words);

  }

}


static const CmdStruct *FindCmd(std::string_view s)

{

  for (const auto &cs : _cmd_structs) {

    if (cs.cmd == s) return &cs;

  }

  return nullptr;

}


static uint8_t ResolveCaseName(std::string_view str)

{

  uint8_t case_idx = _strgen.lang.GetCaseIndex(str);

  if (case_idx >= MAX_NUM_CASES) StrgenFatal("Invalid case-name '{}'", str);

  return case_idx + 1;

}


/* returns cmd == nullptr on eof */

static ParsedCommandString ParseCommandString(StringConsumer &consumer)

{

  ParsedCommandString result;


  /* Scan to the next command, exit if there's no next command. */

  consumer.SkipUntilChar('{', StringConsumer::KEEP_SEPARATOR);

  if (!consumer.ReadCharIf('{')) return {};


  if (auto argno = consumer.TryReadIntegerBase<uint32_t>(10); argno.has_value()) {

    result.argno = argno;

    if (!consumer.ReadCharIf(':')) StrgenFatal("missing arg #");

  }


  /* parse command name */

  auto command = consumer.ReadUntilCharIn("} =.");

  result.cmd = FindCmd(command);

  if (result.cmd == nullptr) {

    StrgenError("Undefined command '{}'", command);

    return {};

  }


  /* parse case */

  if (consumer.ReadCharIf('.')) {

    if (!result.cmd->flags.Test(CmdFlag::Case)) {

      StrgenFatal("Command '{}' can't have a case", result.cmd->cmd);

    }


    auto casep = consumer.ReadUntilCharIn("} ");

    result.casei = ResolveCaseName(casep);

  }


  /* parse params */

  result.param = consumer.ReadUntilChar('}', StringConsumer::KEEP_SEPARATOR);


  if (!consumer.ReadCharIf('}')) {

    StrgenError("Missing }} from command '{}'", result.cmd->cmd);

    return {};

  }


  return result;

}


StringReader::StringReader(StringData &data, const std::string &file, bool master, bool translation) :

    data(data), file(file), master(master), translation(translation)

{

}

StringReader::StringReader(StringData &data, const std::string &file, bool master, bool translation) : {…}


ParsedCommandStruct ExtractCommandString(std::string_view s, bool)

{

  ParsedCommandStruct p;

  StringConsumer consumer(s);


  size_t argidx = 0;

  for (;;) {

    /* read until next command from a. */

    auto cs = ParseCommandString(consumer);


    if (cs.cmd == nullptr) break;


    /* Sanity checking */

    if (cs.argno.has_value() && cs.cmd->consumes == 0) StrgenFatal("Non consumer param can't have a paramindex");


    if (cs.cmd->consumes > 0) {

      if (cs.argno.has_value()) argidx = *cs.argno;

      if (argidx >= p.consuming_commands.max_size()) StrgenFatal("invalid param idx {}", argidx);

      if (p.consuming_commands[argidx] != nullptr && p.consuming_commands[argidx] != cs.cmd) StrgenFatal("duplicate param idx {}", argidx);


      p.consuming_commands[argidx++] = cs.cmd;

    } else if (!cs.cmd->flags.Test(CmdFlag::DontCount)) { // Ignore some of them

      p.non_consuming_commands.emplace_back(cs.cmd, std::move(cs.param));

    }

  }


  return p;

}


const CmdStruct *TranslateCmdForCompare(const CmdStruct *a)

{

  if (a == nullptr) return nullptr;


  if (a->cmd == "STRING1" ||

      a->cmd == "STRING2" ||

      a->cmd == "STRING3" ||

      a->cmd == "STRING4" ||

      a->cmd == "STRING5" ||

      a->cmd == "STRING6" ||

      a->cmd == "STRING7" ||

      a->cmd == "RAW_STRING") {

    return FindCmd("STRING");

  }


  return a;

}


static bool CheckCommandsMatch(std::string_view a, std::string_view b, std::string_view name)

{

  /* If we're not translating, i.e. we're compiling the base language,

   * it is pointless to do all these checks as it'll always be correct.

   * After all, all checks are based on the base language.

   */

  if (!_strgen.translation) return true;


  bool result = true;


  ParsedCommandStruct templ = ExtractCommandString(b, true);

  ParsedCommandStruct lang = ExtractCommandString(a, true);


  /* For each string in templ, see if we find it in lang */

  if (templ.non_consuming_commands.max_size() != lang.non_consuming_commands.max_size()) {

    StrgenWarning("{}: template string and language string have a different # of commands", name);

    result = false;

  }


  for (auto &templ_nc : templ.non_consuming_commands) {

    /* see if we find it in lang, and zero it out */

    bool found = false;

    for (auto &lang_nc : lang.non_consuming_commands) {

      if (templ_nc.cmd == lang_nc.cmd && templ_nc.param == lang_nc.param) {

        /* it was found in both. zero it out from lang so we don't find it again */

        lang_nc.cmd = nullptr;

        found = true;

        break;

      }

    }


    if (!found) {

      StrgenWarning("{}: command '{}' exists in template file but not in language file", name, templ_nc.cmd->cmd);

      result = false;

    }

  }


  /* if we reach here, all non consumer commands match up.

   * Check if the non consumer commands match up also. */

  for (size_t i = 0; i < templ.consuming_commands.max_size(); i++) {

    if (TranslateCmdForCompare(templ.consuming_commands[i]) != lang.consuming_commands[i]) {

      StrgenWarning("{}: Param idx #{} '{}' doesn't match with template command '{}'", name, i,

        lang.consuming_commands[i]  == nullptr ? "<empty>" : TranslateCmdForCompare(lang.consuming_commands[i])->cmd,

        templ.consuming_commands[i] == nullptr ? "<empty>" : templ.consuming_commands[i]->cmd);

      result = false;

    }

  }


  return result;

}


void StringReader::HandleString(std::string_view src)

{

  /* Ignore blank lines */

  if (src.empty()) return;


  StringConsumer consumer(src);

  if (consumer.ReadCharIf('#')) {

    if (consumer.ReadCharIf('#') && !consumer.ReadCharIf('#')) this->HandlePragma(consumer.Read(StringConsumer::npos), _strgen.lang);

    return; // ignore comments

  }


  /* Read string name */

  std::string_view str_name = StrTrimView(consumer.ReadUntilChar(':', StringConsumer::KEEP_SEPARATOR), StringConsumer::WHITESPACE_NO_NEWLINE);

  if (!consumer.ReadCharIf(':')) {

    StrgenError("Line has no ':' delimiter");

    return;

  }


  /* Read string case */

  std::optional<std::string_view> casep;

  if (auto index = str_name.find("."); index != std::string_view::npos) {

    casep = str_name.substr(index + 1);

    str_name = str_name.substr(0, index);

  }


  /* Read string data */

  std::string_view value = consumer.Read(StringConsumer::npos);


  /* Check string is valid UTF-8 */

  for (StringConsumer validation_consumer(value); validation_consumer.AnyBytesLeft(); ) {

    auto c = validation_consumer.TryReadUtf8();

    if (!c.has_value()) StrgenFatal("Invalid UTF-8 sequence in '{}'", value);

    if (*c <= 0x001F || // ASCII control character range

        *c == 0x200B || // Zero width space

        (*c >= 0xE000 && *c <= 0xF8FF) || // Private range

        (*c >= 0xFFF0 && *c <= 0xFFFF)) { // Specials range

      StrgenFatal("Unwanted UTF-8 character U+{:04X} in sequence '{}'", static_cast<uint32_t>(*c), value);

    }

  }


  /* Check if this string already exists.. */

  LangString *ent = this->data.Find(str_name);


  if (this->master) {

    if (casep.has_value()) {

      StrgenError("Cases in the base translation are not supported.");

      return;

    }


    if (ent != nullptr) {

      StrgenError("String name '{}' is used multiple times", str_name);

      return;

    }


    if (this->data.strings[this->data.next_string_id] != nullptr) {

      StrgenError("String ID 0x{:X} for '{}' already in use by '{}'", this->data.next_string_id, str_name, this->data.strings[this->data.next_string_id]->name);

      return;

    }


    /* Allocate a new LangString */

    this->data.Add(std::make_unique<LangString>(str_name, value, this->data.next_string_id++, _strgen.cur_line));

  } else {

    if (ent == nullptr) {

      StrgenWarning("String name '{}' does not exist in master file", str_name);

      return;

    }


    if (!ent->translated.empty() && !casep.has_value()) {

      StrgenError("String name '{}' is used multiple times", str_name);

      return;

    }


    /* make sure that the commands match */

    if (!CheckCommandsMatch(value, ent->english, str_name)) return;


    if (casep.has_value()) {

      ent->translated_cases.emplace_back(ResolveCaseName(*casep), value);

    } else {

      ent->translated = value;

      /* If the string was translated, use the line from the

       * translated language so errors in the translated file

       * are properly referenced to. */

      ent->line = _strgen.cur_line;

    }

  }

}


void StringReader::HandlePragma(std::string_view str, LanguagePackHeader &lang)

{

  StringConsumer consumer(str);

  auto name = consumer.ReadUntilChar(' ', StringConsumer::SKIP_ALL_SEPARATORS);

  if (name == "plural") {

    lang.plural_form = consumer.ReadIntegerBase<uint32_t>(10);

    if (lang.plural_form >= lengthof(_plural_forms)) {

      StrgenFatal("Invalid pluralform {}", lang.plural_form);

    }

  } else {

    StrgenFatal("unknown pragma '{}'", name);

  }

}

void StringReader::HandlePragma(std::string_view str, LanguagePackHeader &lang) {…}


void StringReader::ParseFile()

{

  _strgen.warnings = _strgen.errors = 0;


  _strgen.translation = this->translation;

  _strgen.file = this->file;


  /* For each new file we parse, reset the genders, and language codes. */

  _strgen.lang = {};


  _strgen.cur_line = 1;

  while (this->data.next_string_id < this->data.max_strings) {

    std::optional<std::string> line = this->ReadLine();

    if (!line.has_value()) return;


    this->HandleString(StrTrimView(line.value(), StringConsumer::WHITESPACE_OR_NEWLINE));

    _strgen.cur_line++;

  }


  if (this->data.next_string_id == this->data.max_strings) {

    StrgenError("Too many strings, maximum allowed is {}", this->data.max_strings);

  }

}

void StringReader::ParseFile() {…}


void HeaderWriter::WriteHeader(const StringData &data)

{

  size_t last = 0;

  for (size_t i = 0; i < data.max_strings; i++) {

    if (data.strings[i] != nullptr) {

      this->WriteStringID(data.strings[i]->name, i);

      last = i;

    }

  }


  this->WriteStringID("STR_LAST_STRINGID", last);

}

void HeaderWriter::WriteHeader(const StringData &data) {…}


static size_t TranslateArgumentIdx(size_t argidx, size_t offset)

{

  if (argidx >= _cur_pcs.consuming_commands.max_size()) {

    StrgenFatal("invalid argidx {}", argidx);

  }

  const CmdStruct *cs = _cur_pcs.consuming_commands[argidx];

  if (cs != nullptr && cs->consumes <= offset) {

    StrgenFatal("invalid argidx offset {}:{}", argidx, offset);

  }


  if (_cur_pcs.consuming_commands[argidx] == nullptr) {

    StrgenFatal("no command for this argidx {}", argidx);

  }


  size_t sum = 0;

  for (size_t i = 0; i < argidx; i++) {

    cs = _cur_pcs.consuming_commands[i];


    if (cs == nullptr && sum > i) continue;


    sum += (cs != nullptr) ? cs->consumes : 1;

  }


  return sum + offset;

}


static void PutArgidxCommand(StringBuilder &builder)

{

  builder.PutUtf8(SCC_ARG_INDEX);

  builder.PutUint8(static_cast<uint8_t>(TranslateArgumentIdx(_cur_argidx)));

}


static std::string PutCommandString(std::string_view str)

{

  std::string result;

  StringBuilder builder(result);

  StringConsumer consumer(str);

  _cur_argidx = 0;


  for (;;) {

    /* Process characters as they are until we encounter a { */

    builder.Put(consumer.ReadUntilChar('{', StringConsumer::KEEP_SEPARATOR));

    if (!consumer.AnyBytesLeft()) break;


    auto cs = ParseCommandString(consumer);

    auto *cmd = cs.cmd;

    if (cmd == nullptr) break;


    if (cs.casei.has_value()) {

      builder.PutUtf8(SCC_SET_CASE); // {SET_CASE}

      builder.PutUint8(*cs.casei);

    }


    /* For params that consume values, we need to handle the argindex properly */

    if (cmd->consumes > 0) {

      /* Check if we need to output a move-param command */

      if (cs.argno.has_value() && *cs.argno != _cur_argidx) {

        _cur_argidx = *cs.argno;

        PutArgidxCommand(builder);

      }


      /* Output the one from the master string... it's always accurate. */

      cmd = _cur_pcs.consuming_commands[_cur_argidx++];

      if (cmd == nullptr) {

        StrgenFatal("{}: No argument exists at position {}", _cur_ident, _cur_argidx - 1);

      }

    }


    cmd->proc(builder, cs.param, cmd->value);

  }

  return result;

}


void LanguageWriter::WriteLength(size_t length)

{

  char buffer[2];

  size_t offs = 0;

  if (length >= 0x4000) {

    StrgenFatal("string too long");

  }


  if (length >= 0xC0) {

    buffer[offs++] = static_cast<char>(static_cast<uint8_t>((length >> 8) | 0xC0));

  }

  buffer[offs++] = static_cast<char>(static_cast<uint8_t>(length & 0xFF));

  this->Write({buffer, offs});

}

void LanguageWriter::WriteLength(size_t length) {…}


void LanguageWriter::WriteLang(const StringData &data)

{

  std::vector<size_t> in_use;

  for (size_t tab = 0; tab < data.tabs; tab++) {

    size_t n = data.CountInUse(tab);


    in_use.push_back(n);

    _strgen.lang.offsets[tab] = TO_LE16(static_cast<uint16_t>(n));


    for (size_t j = 0; j != in_use[tab]; j++) {

      const LangString *ls = data.strings[(tab * TAB_SIZE) + j].get();

      if (ls != nullptr && ls->translated.empty()) _strgen.lang.missing++;

    }

  }


  _strgen.lang.ident = TO_LE32(LanguagePackHeader::IDENT);

  _strgen.lang.version = TO_LE32(data.Version());

  _strgen.lang.missing = TO_LE16(_strgen.lang.missing);

  _strgen.lang.winlangid = TO_LE16(_strgen.lang.winlangid);


  this->WriteHeader(&_strgen.lang);


  for (size_t tab = 0; tab < data.tabs; tab++) {

    for (size_t j = 0; j != in_use[tab]; j++) {

      const LangString *ls = data.strings[(tab * TAB_SIZE) + j].get();


      /* For undefined strings, just set that it's an empty string */

      if (ls == nullptr) {

        this->WriteLength(0);

        continue;

      }


      std::string output;

      StringBuilder builder(output);

      _cur_ident = ls->name;

      _strgen.cur_line = ls->line;


      /* Produce a message if a string doesn't have a translation. */

      if (ls->translated.empty()) {

        if (_strgen.show_warnings) {

          StrgenWarning("'{}' is untranslated", ls->name);

        }

        if (_strgen.annotate_todos) {

          builder.Put("<TODO> ");

        }

      }


      /* Extract the strings and stuff from the english command string */

      _cur_pcs = ExtractCommandString(ls->english, false);


      _translated = !ls->translated_cases.empty() || !ls->translated.empty();

      const std::string &cmdp = _translated ? ls->translated : ls->english;


      if (!ls->translated_cases.empty()) {

        /* Need to output a case-switch.

         * It has this format

         * <0x9E> <NUM CASES> <CASE1> <LEN1> <STRING1> <CASE2> <LEN2> <STRING2> <CASE3> <LEN3> <STRING3> <LENDEFAULT> <STRINGDEFAULT>

         * Each LEN is printed using 2 bytes in little endian order. */

        builder.PutUtf8(SCC_SWITCH_CASE);

        builder.PutUint8(static_cast<uint8_t>(ls->translated_cases.size()));


        /* Write each case */

        for (const Case &c : ls->translated_cases) {

          auto case_str = PutCommandString(c.string);

          builder.PutUint8(c.caseidx);

          builder.PutUint16LE(static_cast<uint16_t>(case_str.size()));

          builder.Put(case_str);

        }

      }


      std::string def_str;

      if (!cmdp.empty()) def_str = PutCommandString(cmdp);

      if (!ls->translated_cases.empty()) {

        builder.PutUint16LE(static_cast<uint16_t>(def_str.size()));

      }

      builder.Put(def_str);


      this->WriteLength(output.size());

      this->Write(output);

    }

  }

}

void LanguageWriter::WriteLang(const StringData &data) {…}

BaseBitSet::Test
constexpr bool Test(Tvalue_type value) const
Test if the value-th bit is set.
Definition base_bitset_type.hpp:141

BaseStringBuilder::PutUtf8
void PutUtf8(char32_t c)
Append UTF.8 char.
Definition string_builder.cpp:113

BaseStringBuilder::PutUint16LE
void PutUint16LE(uint16_t value)
Append binary uint16 using little endian.
Definition string_builder.cpp:37

BaseStringBuilder::Put
void Put(std::string_view str)
Append string.
Definition string_builder.hpp:34

BaseStringBuilder::PutUint8
void PutUint8(uint8_t value)
Append binary uint8.
Definition string_builder.cpp:18

StringBuilder
Compose data into a growing std::string.
Definition string_builder.hpp:65

StringConsumer
Parse data from a string / buffer.
Definition string_consumer.hpp:27

StringConsumer::ReadCharIf
bool ReadCharIf(char c)
Check whether the next 8-bit char matches 'c', and skip it.
Definition string_consumer.hpp:478

StringConsumer::TryReadIntegerBase
std::optional< T > TryReadIntegerBase(int base, bool clamp=false)
Try to read and parse an integer in number 'base', and then advance the reader.
Definition string_consumer.hpp:874

StringConsumer::ReadUntilChar
std::string_view ReadUntilChar(char c, SeparatorUsage sep)
Read data until the first occurrence of 8-bit char 'c', and advance reader.
Definition string_consumer.hpp:765

StringConsumer::SkipUntilChar
void SkipUntilChar(char c, SeparatorUsage sep)
Skip data until the first occurrence of 8-bit char 'c'.
Definition string_consumer.hpp:774

StringConsumer::SKIP_ALL_SEPARATORS
@ SKIP_ALL_SEPARATORS
Read and discard all consecutive separators, do not include any in the result.
Definition string_consumer.hpp:697

StringConsumer::KEEP_SEPARATOR
@ KEEP_SEPARATOR
Keep the separator in the data as next value to be read.
Definition string_consumer.hpp:695

StringConsumer::AnyBytesLeft
bool AnyBytesLeft() const noexcept
Check whether any bytes left to read.
Definition string_consumer.hpp:70

StringConsumer::WHITESPACE_OR_NEWLINE
static const std::string_view WHITESPACE_OR_NEWLINE
ASCII whitespace characters, including new-line.
Definition string_consumer.hpp:45

StringConsumer::WHITESPACE_NO_NEWLINE
static const std::string_view WHITESPACE_NO_NEWLINE
ASCII whitespace characters, excluding new-line.
Definition string_consumer.hpp:40

StringConsumer::SkipUntilCharNotIn
void SkipUntilCharNotIn(std::string_view chars)
Skip 8-bit chars, while they are in 'chars', until they are not.
Definition string_consumer.hpp:683

StringConsumer::ReadUntilCharIn
std::string_view ReadUntilCharIn(std::string_view chars)
Read 8-bit chars, while they are not in 'chars', until they are; and advance reader.
Definition string_consumer.hpp:648

StringConsumer::ReadIntegerBase
T ReadIntegerBase(int base, T def=0, bool clamp=false)
Read and parse an integer in number 'base', and advance the reader.
Definition string_consumer.hpp:891

StringConsumer::Read
std::string_view Read(size_type len)
Read the next 'len' bytes, and advance reader.
Definition string_consumer.hpp:530

StringConsumer::npos
static constexpr size_type npos
Special value for "end of data".
Definition string_consumer.hpp:34

MAX_NUM_GENDERS
static const uint8_t MAX_NUM_GENDERS
Maximum number of supported genders.
Definition language.h:20

MAX_NUM_CASES
static const uint8_t MAX_NUM_CASES
Maximum number of supported cases.
Definition language.h:21

IsInsideBS
constexpr bool IsInsideBS(const T x, const size_t base, const size_t size)
Checks if a value is between a window started at some base point.
Definition math_func.hpp:252

lengthof
#define lengthof(array)
Return the length of an fixed size array.
Definition stdafx.h:271

strgen.h
Structures related to strgen.

_translated
static bool _translated
Whether the current language is not the master language.
Definition strgen_base.cpp:25

VersionHashStr
static uint32_t VersionHashStr(uint32_t hash, std::string_view s)
Create a compound hash.
Definition strgen_base.cpp:117

_plural_forms
static const PluralForm _plural_forms[]
All plural forms used.
Definition strgen_tables.h:172

CmdFlag::Gender
@ Gender
These commands support genders.

CmdFlag::Case
@ Case
These commands support cases.

CmdFlag::DontCount
@ DontCount
These commands aren't counted for comparison.

TAB_SIZE
static const uint TAB_SIZE
Number of strings per StringTab.
Definition strings_type.h:52

Case
Container for the different cases of a string.
Definition strgen.h:22

Case::Case
Case(uint8_t caseidx, std::string_view string)
Create a new case.
Definition strgen_base.cpp:44

CmdStruct
Definition strgen_tables.h:22

HeaderWriter::WriteStringID
virtual void WriteStringID(const std::string &name, size_t stringid)=0
Write the string ID.

HeaderWriter::WriteHeader
void WriteHeader(const StringData &data)
Write the header information.
Definition strgen_base.cpp:611

LangString
Information about a single string.
Definition strgen.h:30

LangString::line
size_t line
Line of string in source-file.
Definition strgen.h:35

LangString::english
std::string english
English text.
Definition strgen.h:32

LangString::translated_cases
std::vector< Case > translated_cases
Cases of the translation.
Definition strgen.h:36

LangString::translated
std::string translated
Translated text.
Definition strgen.h:33

LangString::FreeTranslation
void FreeTranslation()
Free all data related to the translation.
Definition strgen_base.cpp:62

LangString::name
std::string name
Name of the string.
Definition strgen.h:31

LangString::LangString
LangString(std::string_view name, std::string_view english, size_t index, size_t line)
Create a new string.
Definition strgen_base.cpp:56

LanguagePackHeader
Header of a language file.
Definition language.h:24

LanguagePackHeader::GetCaseIndex
uint8_t GetCaseIndex(std::string_view case_str) const
Get the index for the given case.
Definition language.h:81

LanguagePackHeader::plural_form
uint8_t plural_form
plural form index
Definition language.h:41

LanguagePackHeader::version
uint32_t version
32-bits of auto generated version info which is basically a hash of strings.h
Definition language.h:28

LanguagePackHeader::offsets
uint16_t offsets[TEXT_TAB_END]
the offsets
Definition language.h:32

LanguagePackHeader::winlangid
uint16_t winlangid
Windows language ID: Windows cannot and will not convert isocodes to something it can use to determin...
Definition language.h:51

LanguagePackHeader::num_genders
uint8_t num_genders
the number of genders of this language
Definition language.h:53

LanguagePackHeader::missing
uint16_t missing
number of missing strings.
Definition language.h:40

LanguagePackHeader::ident
uint32_t ident
32-bits identifier
Definition language.h:27

LanguagePackHeader::IDENT
static const uint32_t IDENT
Identifier for OpenTTD language files, big endian for "LANG".
Definition language.h:25

LanguagePackHeader::GetGenderIndex
uint8_t GetGenderIndex(std::string_view gender_str) const
Get the index for the given gender.
Definition language.h:68

LanguageWriter::WriteHeader
virtual void WriteHeader(const LanguagePackHeader *header)=0
Write the header metadata.

LanguageWriter::WriteLength
virtual void WriteLength(size_t length)
Write the length as a simple gamma.
Definition strgen_base.cpp:701

LanguageWriter::Write
virtual void Write(std::string_view buffer)=0
Write a number of bytes.

LanguageWriter::WriteLang
virtual void WriteLang(const StringData &data)
Actually write the language.
Definition strgen_base.cpp:720

ParsedCommandString
Definition strgen_base.cpp:30

ParsedCommandStruct
Definition strgen.h:142

PluralForm::plural_count
size_t plural_count
The number of plural forms.
Definition strgen_tables.h:163

StrgenState
Global state shared between strgen.cpp, game_text.cpp and strgen_base.cpp.
Definition strgen.h:159

StrgenState::file
std::string file
The filename of the input, so we can refer to it in errors/warnings.
Definition strgen.h:160

StrgenState::translation
bool translation
Is the current file actually a translation or not.
Definition strgen.h:166

StrgenState::lang
LanguagePackHeader lang
Header information about a language.
Definition strgen.h:167

StrgenState::cur_line
size_t cur_line
The current line we're parsing in the input file.
Definition strgen.h:161

StringData
Information about the currently known strings.
Definition strgen.h:43

StringData::tabs
size_t tabs
The number of 'tabs' of strings.
Definition strgen.h:46

StringData::Add
void Add(std::shared_ptr< LangString > ls)
Add a newly created LangString.
Definition strgen_base.cpp:92

StringData::max_strings
size_t max_strings
The maximum number of strings.
Definition strgen.h:47

StringData::next_string_id
size_t next_string_id
The next string ID to allocate.
Definition strgen.h:48

StringData::FreeTranslation
void FreeTranslation()
Free all data related to the translation.
Definition strgen_base.cpp:79

StringData::Find
LangString * Find(std::string_view s)
Find a LangString based on the string name.
Definition strgen_base.cpp:103

StringData::StringData
StringData(size_t tabs)
Create a new string data container.
Definition strgen_base.cpp:72

StringData::name_to_string
std::unordered_map< std::string, std::shared_ptr< LangString >, StringHash, std::equal_to<> > name_to_string
Lookup table for the strings.
Definition strgen.h:45

StringData::strings
std::vector< std::shared_ptr< LangString > > strings
List of all known strings.
Definition strgen.h:44

StringData::Version
uint32_t Version() const
Make a hash of the file to get a unique "version number".
Definition strgen_base.cpp:130

StringData::CountInUse
size_t CountInUse(size_t tab) const
Count the number of tab elements that are in use.
Definition strgen_base.cpp:160

StringReader::file
const std::string file
The file we are reading.
Definition strgen.h:61

StringReader::StringReader
StringReader(StringData &data, const std::string &file, bool master, bool translation)
Prepare reading.
Definition strgen_base.cpp:379

StringReader::data
StringData & data
The data to fill during reading.
Definition strgen.h:60

StringReader::ParseFile
virtual void ParseFile()
Start parsing the file.
Definition strgen_base.cpp:583

StringReader::translation
bool translation
Are we reading a translation, implies !master. However, the base translation will have this false.
Definition strgen.h:63

StringReader::HandlePragma
virtual void HandlePragma(std::string_view str, LanguagePackHeader &lang)
Handle the pragma of the file.
Definition strgen_base.cpp:569

StringReader::ReadLine
virtual std::optional< std::string > ReadLine()=0
Read a single line from the source of strings.

StringReader::master
bool master
Are we reading the master file?
Definition strgen.h:62