WebAssembly - 新しいオペコードの追加
WebAssembly (Wasm) は、スタックベースの仮想マシン向けのバイナリ命令形式です。このチュートリアルでは、V8に新しいWebAssembly命令を実装する方法を説明します。
WebAssemblyはV8で3つの部分に実装されています。
- インタープリタ
- ベースラインコンパイラ(Liftoff)
- 最適化コンパイラ(TurboFan)
このドキュメントの残りの部分では、TurboFanパイプラインに焦点を当て、新しいWasm命令を追加してTurboFanで実装する方法を説明します。
高いレベルでは、Wasm命令はTurboFanグラフにコンパイルされ、TurboFanパイプラインを使用してグラフを(最終的には)マシンコードにコンパイルします。TurboFanの詳細については、V8ドキュメントを参照してください。
オペコード/命令 #
スタックの一番上に1
をint32
に追加する新しい命令を定義しましょう。
注記:すべてのWasm実装でサポートされている命令のリストは、仕様にあります。
すべてのWasm命令は、src/wasm/wasm-opcodes.h
で定義されています。命令は、制御、メモリ、SIMD、アトミックなど、おおよそそれらが実行する機能によってグループ化されています。
新しい命令I32Add1
をFOREACH_SIMPLE_OPCODE
セクションに追加しましょう。
diff --git a/src/wasm/wasm-opcodes.h b/src/wasm/wasm-opcodes.h
index 6970c667e7..867cbf451a 100644
--- a/src/wasm/wasm-opcodes.h
+++ b/src/wasm/wasm-opcodes.h
@@ -96,6 +96,7 @@ bool IsJSCompatibleSignature(const FunctionSig* sig, bool hasBigIntFeature);
// Expressions with signatures.
#define FOREACH_SIMPLE_OPCODE(V) \
+ V(I32Add1, 0xee, i_i) \
V(I32Eqz, 0x45, i_i) \
V(I32Eq, 0x46, i_ii) \
V(I32Ne, 0x47, i_ii) \
WebAssemblyはバイナリ形式であるため、0xee
はこの命令のエンコーディングを指定します。このチュートリアルでは、現在使用されていない0xee
を選択しました。
注記:実際に仕様に命令を追加するには、ここで説明されている以上の作業が必要です。
オペコードの簡単な単体テストを実行するには、以下を実行します。
$ tools/dev/gm.py x64.debug unittests/WasmOpcodesTest*
...
[==========] Running 1 test from 1 test suite.
[----------] Global test environment set-up.
[----------] 1 test from WasmOpcodesTest
[ RUN ] WasmOpcodesTest.EveryOpcodeHasAName
../../test/unittests/wasm/wasm-opcodes-unittest.cc:27: Failure
Value of: false
Actual: false
Expected: true
WasmOpcodes::OpcodeName(kExprI32Add1) == "unknown"; plazz halp in src/wasm/wasm-opcodes.cc
[ FAILED ] WasmOpcodesTest.EveryOpcodeHasAName
このエラーは、新しい命令に名前がないことを示しています。新しいオペコードの名前は、src/wasm/wasm-opcodes.cc
に追加できます。
diff --git a/src/wasm/wasm-opcodes.cc b/src/wasm/wasm-opcodes.cc
index 5ed664441d..2d4e9554fe 100644
--- a/src/wasm/wasm-opcodes.cc
+++ b/src/wasm/wasm-opcodes.cc
@@ -75,6 +75,7 @@ const char* WasmOpcodes::OpcodeName(WasmOpcode opcode) {
// clang-format off
// Standard opcodes
+ CASE_I32_OP(Add1, "add1")
CASE_INT_OP(Eqz, "eqz")
CASE_ALL_OP(Eq, "eq")
CASE_I64x2_OP(Eq, "eq")
FOREACH_SIMPLE_OPCODE
に新しい命令を追加することで、Wasmオペコードをデコードし、TurboFanグラフジェネレーターを呼び出すsrc/wasm/function-body-decoder-impl.h
で行われるかなりの作業をスキップしています。したがって、オペコードが実行する内容によっては、さらに作業が必要になる場合があります。簡潔にするために、ここではスキップします。
新しいオペコードのテストの作成 #
Wasmテストは、test/cctest/wasm/
にあります。「単純な」オペコードの多くがテストされているtest/cctest/wasm/test-run-wasm.cc
を見てみましょう。
このファイルには、私たちが従うことができる多くの例があります。一般的な設定は次のとおりです。
WasmRunner
を作成する- 結果を保持するグローバル変数を設定する(オプション)
- 命令へのパラメーターとしてローカル変数を設定する(オプション)
- Wasmモジュールをビルドする
- 実行して、予想される出力と比較する
新しいオペコードの簡単なテストを次に示します。
diff --git a/test/cctest/wasm/test-run-wasm.cc b/test/cctest/wasm/test-run-wasm.cc
index 26df61ceb8..b1ee6edd71 100644
--- a/test/cctest/wasm/test-run-wasm.cc
+++ b/test/cctest/wasm/test-run-wasm.cc
@@ -28,6 +28,15 @@ namespace test_run_wasm {
#define RET(x) x, kExprReturn
#define RET_I8(x) WASM_I32V_2(x), kExprReturn
+#define WASM_I32_ADD1(x) x, kExprI32Add1
+
+WASM_EXEC_TEST(Int32Add1) {
+ WasmRunner<int32_t> r(execution_tier);
+ // 10 + 1
+ BUILD(r, WASM_I32_ADD1(WASM_I32V_1(10)));
+ CHECK_EQ(11, r.Call());
+}
+
WASM_EXEC_TEST(Int32Const) {
WasmRunner<int32_t> r(execution_tier);
const int32_t kExpectedValue = 0x11223344;
テストを実行する
$ tools/dev/gm.py x64.debug 'cctest/test-run-wasm-simd/RunWasmTurbofan_I32Add1'
...
=== cctest/test-run-wasm/RunWasmTurbofan_Int32Add1 ===
#
# Fatal error in ../../src/compiler/wasm-compiler.cc, line 988
# Unsupported opcode 0xee:i32.add1
ヒント:テスト定義はマクロの背後にあるため、テスト名を見つけるのは難しい場合があります。コード検索を使用して、マクロ定義を調べるためにクリックしてください。
このエラーは、コンパイラが新しい命令を知らないことを示しています。これは次のセクションで変更されます。
WasmをTurboFanにコンパイルする #
はじめに、Wasm命令はTurboFanグラフにコンパイルされると述べました。これが行われるのはwasm-compiler.cc
です。I32Eqz
という例を示すオペコードを見てみましょう。
switch (opcode) {
case wasm::kExprI32Eqz:
op = m->Word32Equal();
return graph()->NewNode(op, input, mcgraph()->Int32Constant(0));
これはWasmオペコードwasm::kExprI32Eqz
を切り替え、Wasm命令の引数であるinput
と定数0
を入力とするWord32Equal
演算からなるTurboFanグラフを構築します。
Word32Equal
演算子は、アーキテクチャに依存しない基盤となるV8抽象マシンによって提供されます。パイプラインの後半で、この抽象マシン演算子は、アーキテクチャに依存するアセンブリに変換されます。
新しいオペコードI32Add1
の場合、入力に定数1を追加するグラフが必要なので、既存のマシン演算子Int32Add
を再利用し、入力と定数1を渡すことができます。
diff --git a/src/compiler/wasm-compiler.cc b/src/compiler/wasm-compiler.cc
index f666bbb7c1..399293c03b 100644
--- a/src/compiler/wasm-compiler.cc
+++ b/src/compiler/wasm-compiler.cc
@@ -713,6 +713,8 @@ Node* WasmGraphBuilder::Unop(wasm::WasmOpcode opcode, Node* input,
const Operator* op;
MachineOperatorBuilder* m = mcgraph()->machine();
switch (opcode) {
+ case wasm::kExprI32Add1:
+ return graph()->NewNode(m->Int32Add(), input, mcgraph()->Int32Constant(1));
case wasm::kExprI32Eqz:
op = m->Word32Equal();
return graph()->NewNode(op, input, mcgraph()->Int32Constant(0));
これでテストがパスするようになります。ただし、すべての命令に既存のTurboFanマシン演算子があるわけではありません。その場合、この新しい演算子をマシンに追加する必要があります。それを試してみましょう。
TurboFanマシン演算子 #
Int32Add1
に関する知識をTurboFanマシンに追加したいと考えています。そのため、それが存在すると仮定して、最初に使用してみましょう。
diff --git a/src/compiler/wasm-compiler.cc b/src/compiler/wasm-compiler.cc
index f666bbb7c1..1d93601584 100644
--- a/src/compiler/wasm-compiler.cc
+++ b/src/compiler/wasm-compiler.cc
@@ -713,6 +713,8 @@ Node* WasmGraphBuilder::Unop(wasm::WasmOpcode opcode, Node* input,
const Operator* op;
MachineOperatorBuilder* m = mcgraph()->machine();
switch (opcode) {
+ case wasm::kExprI32Add1:
+ return graph()->NewNode(m->Int32Add1(), input);
case wasm::kExprI32Eqz:
op = m->Word32Equal();
return graph()->NewNode(op, input, mcgraph()->Int32Constant(0));
同じテストを実行しようとすると、変更を加える場所を示唆するコンパイルエラーが発生します。
../../src/compiler/wasm-compiler.cc:717:34: error: no member named 'Int32Add1' in 'v8::internal::compiler::MachineOperatorBuilder'; did you mean 'Int32Add'?
return graph()->NewNode(m->Int32Add1(), input);
^~~~~~~~~
Int32Add
演算子を追加するために変更が必要な場所はいくつかあります。
src/compiler/machine-operator.cc
- ヘッダー
src/compiler/machine-operator.h
- マシンが理解するオペコードのリスト
src/compiler/opcodes.h
- 検証ツール
src/compiler/verifier.cc
diff --git a/src/compiler/machine-operator.cc b/src/compiler/machine-operator.cc
index 16e838c2aa..fdd6d951f0 100644
--- a/src/compiler/machine-operator.cc
+++ b/src/compiler/machine-operator.cc
@@ -136,6 +136,7 @@ MachineType AtomicOpType(Operator const* op) {
#define MACHINE_PURE_OP_LIST(V) \
PURE_BINARY_OP_LIST_32(V) \
PURE_BINARY_OP_LIST_64(V) \
+ V(Int32Add1, Operator::kNoProperties, 1, 0, 1) \
V(Word32Clz, Operator::kNoProperties, 1, 0, 1) \
V(Word64Clz, Operator::kNoProperties, 1, 0, 1) \
V(Word32ReverseBytes, Operator::kNoProperties, 1, 0, 1) \
diff --git a/src/compiler/machine-operator.h b/src/compiler/machine-operator.h
index a2b9fce0ee..f95e75a445 100644
--- a/src/compiler/machine-operator.h
+++ b/src/compiler/machine-operator.h
@@ -265,6 +265,8 @@ class V8_EXPORT_PRIVATE MachineOperatorBuilder final
const Operator* Word32PairShr();
const Operator* Word32PairSar();
+ const Operator* Int32Add1();
+
const Operator* Int32Add();
const Operator* Int32AddWithOverflow();
const Operator* Int32Sub();
diff --git a/src/compiler/opcodes.h b/src/compiler/opcodes.h
index ce24a0bd3f..2c8c5ebaca 100644
--- a/src/compiler/opcodes.h
+++ b/src/compiler/opcodes.h
@@ -506,6 +506,7 @@
V(Float64LessThanOrEqual)
#define MACHINE_UNOP_32_LIST(V) \
+ V(Int32Add1) \
V(Word32Clz) \
V(Word32Ctz) \
V(Int32AbsWithOverflow) \
diff --git a/src/compiler/verifier.cc b/src/compiler/verifier.cc
index 461aef0023..95251934ce 100644
--- a/src/compiler/verifier.cc
+++ b/src/compiler/verifier.cc
@@ -1861,6 +1861,7 @@ void Verifier::Visitor::Check(Node* node, const AllNodes& all) {
case IrOpcode::kSignExtendWord16ToInt64:
case IrOpcode::kSignExtendWord32ToInt64:
case IrOpcode::kStaticAssert:
+ case IrOpcode::kInt32Add1:
#define SIMD_MACHINE_OP_CASE(Name) case IrOpcode::k##Name:
MACHINE_SIMD_OP_LIST(SIMD_MACHINE_OP_CASE)
テストを再度実行すると、別のエラーが発生します。
=== cctest/test-run-wasm/RunWasmTurbofan_Int32Add1 ===
#
# Fatal error in ../../src/compiler/backend/instruction-selector.cc, line 2072
# Unexpected operator #289:Int32Add1 @ node #7
命令選択 #
これまで、TurboFanレベルで作業し、TurboFanグラフ内の(多数の)ノードを扱ってきました。ただし、アセンブリレベルでは、命令とオペランドがあります。命令選択とは、このグラフを命令とオペランドに変換するプロセスです。
最後のテストエラーは、src/compiler/backend/instruction-selector.cc
に何かが必要であることを示していました。これは、すべてマシンオペコードに関する巨大なswitch文を含む大きなファイルです。これは、ビジターパターンを使用して各タイプのノードの命令を出力することにより、アーキテクチャ固有の命令選択を呼び出します。
新しいTurboFanマシンオペコードを追加したので、ここにも追加する必要があります。
diff --git a/src/compiler/backend/instruction-selector.cc b/src/compiler/backend/instruction-selector.cc
index 3152b2d41e..7375085649 100644
--- a/src/compiler/backend/instruction-selector.cc
+++ b/src/compiler/backend/instruction-selector.cc
@@ -2067,6 +2067,8 @@ void InstructionSelector::VisitNode(Node* node) {
return MarkAsWord32(node), VisitS1x16AnyTrue(node);
case IrOpcode::kS1x16AllTrue:
return MarkAsWord32(node), VisitS1x16AllTrue(node);
+ case IrOpcode::kInt32Add1:
+ return MarkAsWord32(node), VisitInt32Add1(node);
default:
FATAL("Unexpected operator #%d:%s @ node #%d", node->opcode(),
node->op()->mnemonic(), node->id());
命令選択はアーキテクチャに依存するため、アーキテクチャ固有の命令選択ファイルにも追加する必要があります。このコードラボでは、x64アーキテクチャのみに焦点を当てているため、src/compiler/backend/x64/instruction-selector-x64.cc
を変更する必要があります。
diff --git a/src/compiler/backend/x64/instruction-selector-x64.cc b/src/compiler/backend/x64/instruction-selector-x64.cc
index 2324e119a6..4b55671243 100644
--- a/src/compiler/backend/x64/instruction-selector-x64.cc
+++ b/src/compiler/backend/x64/instruction-selector-x64.cc
@@ -841,6 +841,11 @@ void InstructionSelector::VisitWord32ReverseBytes(Node* node) {
Emit(kX64Bswap32, g.DefineSameAsFirst(node), g.UseRegister(node->InputAt(0)));
}
+void InstructionSelector::VisitInt32Add1(Node* node) {
+ X64OperandGenerator g(this);
+ Emit(kX64Int32Add1, g.DefineSameAsFirst(node), g.UseRegister(node->InputAt(0)));
+}
+
また、新しいx64固有のオペコードkX64Int32Add1
をsrc/compiler/backend/x64/instruction-codes-x64.h
に追加する必要があります。
diff --git a/src/compiler/backend/x64/instruction-codes-x64.h b/src/compiler/backend/x64/instruction-codes-x64.h
index 9b8be0e0b5..7f5faeb87b 100644
--- a/src/compiler/backend/x64/instruction-codes-x64.h
+++ b/src/compiler/backend/x64/instruction-codes-x64.h
@@ -12,6 +12,7 @@ namespace compiler {
// X64-specific opcodes that specify which assembly sequence to emit.
// Most opcodes specify a single instruction.
#define TARGET_ARCH_OPCODE_LIST(V) \
+ V(X64Int32Add1) \
V(X64Add) \
V(X64Add32) \
V(X64And) \
命令スケジューリングとコード生成 #
テストを実行すると、新しいコンパイルエラーが表示されます。
../../src/compiler/backend/x64/instruction-scheduler-x64.cc:15:11: error: enumeration value 'kX64Int32Add1' not handled in switch [-Werror,-Wswitch]
switch (instr->arch_opcode()) {
^
1 error generated.
...
../../src/compiler/backend/x64/code-generator-x64.cc:733:11: error: enumeration value 'kX64Int32Add1' not handled in switch [-Werror,-Wswitch]
switch (arch_opcode) {
^
1 error generated.
命令スケジューリングは、命令が持つ可能性のある依存関係を処理して、より多くの最適化(例:命令の並べ替え)を可能にします。新しいオペコードにはデータ依存関係がないため、次のように簡単に追加できます。src/compiler/backend/x64/instruction-scheduler-x64.cc
diff --git a/src/compiler/backend/x64/instruction-scheduler-x64.cc b/src/compiler/backend/x64/instruction-scheduler-x64.cc
index 79eda7e78d..3667a84577 100644
--- a/src/compiler/backend/x64/instruction-scheduler-x64.cc
+++ b/src/compiler/backend/x64/instruction-scheduler-x64.cc
@@ -13,6 +13,7 @@ bool InstructionScheduler::SchedulerSupported() { return true; }
int InstructionScheduler::GetTargetInstructionFlags(
const Instruction* instr) const {
switch (instr->arch_opcode()) {
+ case kX64Int32Add1:
case kX64Add:
case kX64Add32:
case kX64And:
コード生成とは、アーキテクチャ固有のオペコードをアセンブリに変換することです。src/compiler/backend/x64/code-generator-x64.cc
に節を追加しましょう。
diff --git a/src/compiler/backend/x64/code-generator-x64.cc b/src/compiler/backend/x64/code-generator-x64.cc
index 61c3a45a16..9c37ed7464 100644
--- a/src/compiler/backend/x64/code-generator-x64.cc
+++ b/src/compiler/backend/x64/code-generator-x64.cc
@@ -731,6 +731,9 @@ CodeGenerator::CodeGenResult CodeGenerator::AssembleArchInstruction(
InstructionCode opcode = instr->opcode();
ArchOpcode arch_opcode = ArchOpcodeField::decode(opcode);
switch (arch_opcode) {
+ case kX64Int32Add1: {
+ break;
+ }
case kArchCallCodeObject: {
if (HasImmediateInput(instr, 0)) {
Handle<Code> code = i.InputCode(0);
ここではコード生成を空のままにして、すべてがコンパイルされることを確認するためにテストを実行できます。
=== cctest/test-run-wasm/RunWasmTurbofan_Int32Add1 ===
#
# Fatal error in ../../test/cctest/wasm/test-run-wasm.cc, line 37
# Check failed: 11 == r.Call() (11 vs. 10).
このエラーは、新しい命令がまだ実装されていないため予想されます。本質的にノーオプであるため、実際の値は変更されていません(10
)。
オペコードを実装するには、add
アセンブリ命令を使用できます。
diff --git a/src/compiler/backend/x64/code-generator-x64.cc b/src/compiler/backend/x64/code-generator-x64.cc
index 6c828d6bc4..260c8619f2 100644
--- a/src/compiler/backend/x64/code-generator-x64.cc
+++ b/src/compiler/backend/x64/code-generator-x64.cc
@@ -744,6 +744,11 @@ CodeGenerator::CodeGenResult CodeGenerator::AssembleArchInstruction(
InstructionCode opcode = instr->opcode();
ArchOpcode arch_opcode = ArchOpcodeField::decode(opcode);
switch (arch_opcode) {
+ case kX64Int32Add1: {
+ DCHECK_EQ(i.OutputRegister(), i.InputRegister(0));
+ __ addl(i.InputRegister(0), Immediate(1));
+ break;
+ }
case kArchCallCodeObject: {
if (HasImmediateInput(instr, 0)) {
Handle<Code> code = i.InputCode(0);
これでテストがパスします。
幸いなことに、addl
は既に実装されています。新しいオペコードに新しいアセンブリ命令の実装が必要な場合は、アセンブリ命令がバイトにエンコードされて出力されるsrc/compiler/backend/x64/assembler-x64.cc
に追加します。
ヒント:生成されたコードを検査するには、cctest
に--print-code
を渡すことができます。
その他のアーキテクチャ #
このコードラボでは、この新しい命令をx64のみに実装しました。その他のアーキテクチャに必要な手順は同様です。TurboFanマシン演算子を追加し、命令選択、スケジューリング、コード生成、アセンブラにプラットフォーム依存のファイルを使用します。
ヒント:arm64など、別のターゲットでこれまでに行ったことをコンパイルすると、リンクエラーが発生する可能性があります。これらのエラーを解決するには、UNIMPLEMENTED()
スタブを追加します。