当前位置：首页 > news >正文

杭州外贸网站多少钱宜兴网站建设价格信息

news 2025/12/21 13:58:28

杭州外贸网站多少钱,宜兴网站建设价格信息,网站记登录账号怎么做,wordpress面包屑导航插件Fury是一个基于JIT动态编译的多语言原生序列化框架#xff0c;支持Java/Python/Golang/C等语言#xff0c;提供全自动的对象多语言/跨语言序列化能力#xff0c;以及相比于别的框架最高20~200倍的性能。引言过去十多年大数据和分布式系统蓬勃发展#xff0c;序列化是其… Fury是一个基于JIT动态编译的多语言原生序列化框架支持Java/Python/Golang/C等语言提供全自动的对象多语言/跨语言序列化能力以及相比于别的框架最高20~200倍的性能。引言过去十多年大数据和分布式系统蓬勃发展序列化是其频繁使用的技术。当对象需要跨进程、跨语言、跨节点传输、持久化、状态读写时都需要进行序列化其性能和易用性影响着系统的运行效率和开发效率。对于Java序列化尽管Kryo[1]等框架提供了相比JDK序列化数倍的性能对于高吞吐、低延迟、大规模数据传输场景序列化仍然是整个系统的性能瓶颈。为了优化序列化的性能分布式系统如Spark[2]、Flink[3]使用了专有行列存二进制格式如tungsten[4]和arrow[5]。这些格式减少了序列化开销但增加了系统的复杂性牺牲了编程的灵活性同时也只覆盖了SQL等关系代数计算专有场景。对于通用分布式编程和跨进程通信序列化性能始终是一个绕不过去的关键问题。同时随着计算和应用场景的日益复杂化系统已经从单一语言的编程范式发展到多语言融合编程对象在语言之间传输的易用性影响着系统开发效率进而影响业务的迭代效率。而已有的跨语言序列化框架protobuf/flatbuffer/msgpack等由于无法支持引用、不支持Zero-Copy、大量手写代码以及生成的类不符合面向对象设计[6]无法给类添加行为导致在易用性、灵活性、动态性和性能上的不足并不能满足通用跨语言编程需求。基于此我们开发了Fury通过一套支持引用、类型嵌入的语言无关协议以及JIT动态编译加速、缓存优化和Zero-Copy等技术实现了任意对象像动态语言自动序列化一样跨语言自动序列化消除了语言之间的编程边界并提供相比于业界别的框架最高20~200倍的性能。 Fury是什么 Fury是一个基于JIT的高性能多语言原生序列化框架专注于提供极致的序列化性能和易用性支持主流编程语言如Java/Python/C/Golang其它语言可轻易扩展多语言/跨语言自动序列化任意对象无需创建IDL文件、手动编译schema生成代码以及将对象转换为中间格式多语言/跨语言自动序列化共享引用和循环引用用户只需要关心对象不需要关心数据重复或者递归错误基于JIT动态编译技术在运行时自动生成序列化代码优化性能增加方法内联、代码缓存和死代码消除减少虚方法调用/条件分支/Hash查找/元数据写入等提供相比其它序列化框架20~200倍以上的性能Zero-Copy序列化支持支持Out of band序列化协议支持堆外内存读写提供缓存友好的二进制随机访问行存格式支持跳过序列化和部分序列化并能和列存自动互转; 除了跨语言能力Fury还具备以下能力无缝替代JDK/Kryo/Hessian等Java序列化框架无需修改任何代码同时提供相比Kryo 20倍以上的性能相比Hessian100倍以上的性能相比JDK自带序列化200倍以上的性能可以大幅提升高性能场景RPC调用和对象持久化效率支持共享引用和循环引用的Golang序列化框架支持对象自动序列化的Golang序列化框架目前Fury已经支持Java、Python、Golang以及C。本文将首先简单介绍如何使用Fury然后将Fury跟别的序列化框架进行功能、性能和易用性比较Fury的实现原理将在后续文章里面详细介绍。如何使用Fury 这里给出跨语言序列化、纯Java序列化以及避免序列化的示例跨语言序列化自定义类型跨语言序列化包含循环引用的自定义类型跨语言零拷贝序列化Drop-in替代Kryo/Hession/JDK序列化通过Fury Format避免序列化序列化自定义类型下面是序列化用户自定义类型的一个示例该类型里面包含多个基本类型以及嵌套类型的字段在业务应用里面相当常见。需要注意自定义类型跨语言序列化之前需要调用registerAPI注册自定义类型建立类型在不同语言之间的映射关系同时保证GoLang等静态语言编译器编译代码时不裁剪掉这部分类型的符号。 Java序列化示例 import com.google.common.collect.*; import io.fury.*; import java.util.*;public class CustomObjectExample {public static class SomeClass1 {Object f1;MapByte, Integer f2;}public static class SomeClass2 {Object f1;String f2;List Object f3;Map Byte, Integer f4;Byte f5;Short f6;Integer f7;Long f8;Float f9;Double f10;short[] f11;List Short f12;}public static Object createObject() {SomeClass1 obj1 new SomeClass1();obj1.f1 true;obj1.f2 ImmutableMap.of((byte) -1, 2);SomeClass2 obj new SomeClass2();obj.f1 obj1;obj.f2 abc;obj.f3 Arrays.asList(abc, abc);obj.f4 ImmutableMap.of((byte) 1, 2);obj.f5 Byte.MAX_VALUE;obj.f6 Short.MAX_VALUE;obj.f7 Integer.MAX_VALUE;obj.f8 Long.MAX_VALUE;obj.f9 1.0f / 2;obj.f10 1 / 3.0;obj.f11 new short[] {(short) 1, (short) 2};obj.f12 ImmutableList.of((short) -1, (short) 4);return obj;} } 纯Java序列化 public class CustomObjectExample {// mvn exec:java -Dexec.mainClassio.fury.examples.CustomObjectExamplepublic static void main(String[] args) {// Fury应该在多个对象序列化之间复用不要每次创建新的Fury实例Fury fury Fury.builder().withLanguage(Language.JAVA).withReferenceTracking(false).withClassRegistrationRequired(false).build();byte[] bytes fury.serialize(createObject());System.out.println(fury.deserialize(bytes));;} } 跨语言序列化 public class CustomObjectExample {// mvn exec:java -Dexec.mainClassio.fury.examples.CustomObjectExamplepublic static void main(String[] args) {// Fury应该在多个对象序列化之间复用不要每次创建新的Fury实例Fury fury Fury.builder().withLanguage(Language.XLANG).withReferenceTracking(false).build();fury.register(SomeClass1.class, example.SomeClass1);fury.register(SomeClass2.class, example.SomeClass2);byte[] bytes fury.serialize(createObject());// bytes can be data serialized by other languages.System.out.println(fury.deserialize(bytes));;} } Python序列化示例 from dataclasses import dataclass from typing import List, Dict import pyfurydataclass class SomeClass2:f1: Any Nonef2: str Nonef3: List[str] Nonef4: Dict[pyfury.Int8Type, pyfury.Int32Type] Nonef5: pyfury.Int8Type Nonef6: pyfury.Int16Type Nonef7: pyfury.Int32Type None# int类型默认会按照long类型进行序列化如果对端是更加narrow的类型# 需要使用pyfury.Int32Type等进行标注f8: int None # 也可以使用pyfury.Int64Type进行标注f9: pyfury.Float32Type Nonef10: float None # 也可以使用pyfury.Float64Type进行标注f11: pyfury.Int16ArrayType Nonef12: List[pyfury.Int16Type] Nonedataclass class SomeClass1:f1: Anyf2: Dict[pyfury.Int8Type, pyfury.Int32Type]if __name__ __main__:fury_ pyfury.Fury(reference_trackingFalse)fury_.register_class(SomeClass1, example.SomeClass1)fury_.register_class(SomeClass2, example.SomeClass2)obj2 SomeClass2(f1True, f2{-1: 2})obj1 SomeClass1(f1obj2,f2abc,f3[abc, abc],f4{1: 2},f52 ** 7 - 1,f62 ** 15 - 1,f72 ** 31 - 1,f82 ** 63 - 1,f91.0 / 2,f101 / 3.0,f11array.array(h, [1, 2]),f12[-1, 4],)data fury_.serialize(obj)# bytes can be data serialized by other languages.print(fury_.deserialize(data)) GoLang序列化示例 package mainimport code.alipay.com/ray-project/fury/go/fury import fmtfunc main() {type SomeClass1 struct {F1 interface{}F2 stringF3 []interface{}F4 map[int8]int32F5 int8F6 int16F7 int32F8 int64F9 float32F10 float64F11 []int16F12 fury.Int16Slice}type SomeClas2 struct {F1 interface{}F2 map[int8]int32}fury_ : fury.NewFury(false)if err : fury_.RegisterTagType(example.SomeClass1, SomeClass1{}); err ! nil {panic(err)}if err : fury_.RegisterTagType(example.SomeClass2, SomeClass2{}); err ! nil {panic(err)}obj2 : SomeClass2{}obj2.F1 trueobj2.F2 map[int8]int32{-1: 2}obj : SomeClass1{}obj.F1 obj2obj.F2 abcobj.F3 []interface{}{abc, abc}f4 : map[int8]int32{1: 2}obj.F4 f4obj.F5 fury.MaxInt8obj.F6 fury.MaxInt16obj.F7 fury.MaxInt32obj.F8 fury.MaxInt64obj.F9 1.0 / 2obj.F10 1 / 3.0obj.F11 []int16{1, 2}obj.F12 []int16{-1, 4}bytes, err : fury_.Marshal(value)if err ! nil {}var newValue interface{}// bytes can be data serialized by other languages.if err : fury_.Unmarshal(bytes, newValue); err ! nil {panic(err)}fmt.Println(newValue) } 序列化共享循环引用共享引用和循环引用是程序里面常见的构造很多数据结构如图都包含大量的循环引用而手动实现这些包含共享引用和循环引用的对象需要大量冗长复杂易出错的代码。跨语言序列化框架支持循环引用可以极大简化这些复杂场景的序列化加速业务迭代效率。下面是一个包含循环引用的自定义类型跨语言序列化示例。 Java序列化示例 import com.google.common.collect.ImmutableMap; import io.fury.*; import java.util.Map;public class ReferenceExample {public static class SomeClass {SomeClass f1;Map String, String f2;Map String, String f3;}public static Object createObject() {SomeClass obj new SomeClass();obj.f1 obj;obj.f2 ImmutableMap.of(k1, v1, k2, v2);obj.f3 obj.f2;return obj;} } Java序列化 public class ReferenceExample { // mvn exec:java -Dexec.mainClassio.fury.examples.ReferenceExamplepublic static void main(String[] args) {// Fury应该在多个对象序列化之间复用不要每次创建新的Fury实例Fury fury Fury.builder().withLanguage(Language.JAVA).withReferenceTracking(true).withClassRegistrationRequired(false).build();byte[] bytes fury.serialize(createObject());System.out.println(fury.deserialize(bytes));;} } 跨语言序列化 public class ReferenceExample {// mvn exec:java -Dexec.mainClassio.fury.examples.ReferenceExamplepublic static void main(String[] args) {// Fury应该在多个对象序列化之间复用不要每次创建新的Fury实例Fury fury Fury.builder().withLanguage(Language.XLANG).withReferenceTracking(true).build();fury.register(SomeClass.class, example.SomeClass);byte[] bytes fury.serialize(createObject());// bytes can be data serialized by other languages.System.out.println(fury.deserialize(bytes));;} } Python序列化示例 from typing import Dict import pyfuryclass SomeClass:f1: SomeClassf2: Dict[str, str]f3: Dict[str, str]if __name__ __main__:fury_ pyfury.Fury(reference_trackingTrue)fury_.register_class(SomeClass, example.SomeClass)obj SomeClass()obj.f2 {k1: v1, k2: v2}obj.f1, obj.f3 obj, obj.f2data fury_.serialize(obj)# bytes can be data serialized by other languages.print(fury_.deserialize(data)) Golang序列化示例 package mainimport code.alipay.com/ray-project/fury/go/fury import fmtfunc main() {type SomeClass struct {F1 *SomeClassF2 map[string]stringF3 map[string]string}fury_ : fury.NewFury(true)if err : fury_.RegisterTagType(example.SomeClass, SomeClass{}); err ! nil {panic(err)}value : SomeClass{F2: map[string]string{k1: v1, k2: v2}}value.F3 value.F2value.F1 valuebytes, err : fury_.Marshal(value)if err ! nil {}var newValue interface{}// bytes can be data serialized by other languages.if err : fury_.Unmarshal(bytes, newValue); err ! nil {panic(err)}fmt.Println(newValue) } Zero-Copy序列化对于大规模数据传输场景内存拷贝有时会成为整个系统的瓶颈。为此各种语言和框架做了大量优化比如Java提供了NIO能力避免了内存在用户态和内核态之间的来回拷贝Kafka使用Java的NIO来实现零拷贝Python Pickle5提供了Out-Of-Band Buffer[7]序列化能力来避免额外拷贝。对于高性能跨语言数据传输序列化框架也需要能够支持Zero-Copy避免数据Buffer的额外拷贝。下面是一个Fury序列化多个基本类型数组组成的对象树的示例分别对应到Java基本类型数组、Python Numpy数组、Golang 基本类型slice。对于ByteBuffer零拷贝在本文的性能测试部分也给出了部分介绍。 Java序列化示例 Java序列化 import io.fury.*; import io.fury.serializers.BufferObject; import io.fury.memory.MemoryBuffer; import java.util.*; import java.util.stream.Collectors;public class ZeroCopyExample {// mvn exec:java -Dexec.mainClassio.fury.examples.ZeroCopyExamplepublic static void main(String[] args) {// Fury应该在多个对象序列化之间复用不要每次创建新的Fury实例Fury fury Fury.builder().withLanguage(Language.JAVA).withClassRegistrationRequired(false).build();List Object list Arrays.asList(str, new byte[1000], new int[100], new double[100]);CollectionBufferObject bufferObjects new ArrayList();byte[] bytes fury.serialize(list, e - !bufferObjects.add(e));ListMemoryBuffer buffers bufferObjects.stream().map(BufferObject::toBuffer).collect(Collectors.toList());System.out.println(fury.deserialize(bytes, buffers));} } 跨语言序列化 import io.fury.*; import io.fury.serializers.BufferObject; import io.fury.memory.MemoryBuffer; import java.util.*; import java.util.stream.Collectors;public class ZeroCopyExample {// mvn exec:java -Dexec.mainClassio.fury.examples.ZeroCopyExamplepublic static void main(String[] args) {Fury fury Fury.builder().withLanguage(Language.XLANG).build();List Object list Arrays.asList(str, new byte[1000], new int[100], new double[100]);Collection BufferObject bufferObjects new ArrayList();byte[] bytes fury.serialize(list, e - !bufferObjects.add(e));// bytes can be data serialized by other languages.List MemoryBuffer buffers bufferObjects.stream().map(BufferObject::toBuffer).collect(Collectors.toList());System.out.println(fury.deserialize(bytes, buffers));} } Python序列化示例 import array import pyfury import numpy as npif __name__ __main__:fury_ pyfury.Fury()list_ [str, bytes(bytearray(1000)),array.array(i, range(100)), np.full(100, 0.0, dtypenp.double)]serialized_objects []data fury_.serialize(list_, buffer_callbackserialized_objects.append)buffers [o.to_buffer() for o in serialized_objects]# bytes can be data serialized by other languages.print(fury_.deserialize(data, buffersbuffers)) Golang序列化示例 package mainimport code.alipay.com/ray-project/fury/go/fury import fmtfunc main() { fury : fury.NewFury(true)// Golang版本暂不支持其他基本类型slice的zero-copylist : []interface{}{str, make([]byte, 1000)}buf : fury.NewByteBuffer(nil)var serializedObjects []fury.SerializedObjectfury.Serialize(buf, list, func(o fury.SerializedObject) bool {serializedObjects append(serializedObjects, o)return false})var newList []interface{}var buffers []*fury.ByteBufferfor _, o : range serializedObjects {buffers append(buffers, o.ToBuffer())}err : fury.Deserialize(buf, newList, buffers)fmt.Println(newList) Drop-in替换Kryo/Hession 除了多语言原生序列化以外Fury还是一个高性能的通用Java序列化框架可以序列化任意Java Object完全兼容JDK序列化包括支持序列化自定义writeObject/readObject/writeReplace/readResolve的对象支持堆内/堆外内存。可以Drop-in替换jdk/kryo/hession等序列化框架性能最高是Kryo 20倍以上Hession100倍以上JDK自带序列化200倍。下面是一个序列化自定义类型的示例 import io.fury.Fury; import java.util.List; import java.util.Arrays;public class Example {public static void main(String[] args) {SomeClass object new SomeClass();// Fury实例应该在序列化多个对象之间复用不要每次创建新的实例{Fury fury Fury.builder().withLanguage(Language.JAVA)// 设置为true可以避免反序列化未注册的非内置类型// 避免安全漏洞.withClassRegistrationRequired(false).withReferenceTracking(true).build();// 注册类型可以减少classname的序列化不是强制要求// fury.register(SomeClass.class);byte[] bytes fury.serialize(object);System.out.println(fury.deserialize(bytes));}{ThreadSafeFury fury Fury.builder().withLanguage(Language.JAVA).withReferenceTracking(true).withClassRegistrationRequired(false).buildThreadSafeFury();byte[] bytes fury.serialize(object);System.out.println(fury.deserialize(bytes));}{ThreadSafeFury fury new ThreadSafeFury(() - {Fury fury Fury.builder().withLanguage(Language.JAVA).withClassRegistrationRequired(false).withReferenceTracking(true).build();// 注册类型可以减少classname的序列化fury.register(SomeClass.class);return fury;});byte[] bytes fury.serialize(object);System.out.println(fury.deserialize(bytes));}} } 通过Fury Format避免序列化对于有极致性能要求的场景如果用户只需要读取部分数据或者在Serving场景根据对象树某个字段进行过滤和转发可以使用Fury Format来避免其它字段的序列化。Fury Row Format是参考SQL行存和Arrow列存实现的一套可以随机访问的二进制行存结构。目前实现了Java/Python/C版本Python版本通过Cython绑定到C实现。由于该格式是自包含的可以根据schema直接计算出任意字段的offset。因此通过使用该格式可以避免掉序列化直接在二进制数据buffer上面进行所有读写操作这样做有三个优势减少Java GC overhead。由于避免了反序列化因此不会创建对象从而避免了GC问题。避免Python反序列化。Python性能一直很慢因此在跨语言序列化时可以在Java/C侧把对象序列化成Row-Format然后Python侧直接使用该数据计算这样就避免了Python反序列化的昂贵开销。同时由于Python的动态性Fury的BinaryRow/BinaryArrays实现了_getattr__/__getitem__/slice/和其它special methods保证了行为跟python pojo/list/object的一致性用户没有任何感知。缓存友好数据密集存储。 Python示例这里给出一个读取部分数据的样例以及性能测试结果。在下面这个序列化场景中需要读取第二个数组字段的第10万个元素Fury耗时几乎为0而pickler需要8秒。 dataclass class Bar:f1: strf2: List[pa.int64]dataclass class Foo:f1: pa.int32f2: List[pa.int32]f3: Dict[str, pa.int32]f4: List[Bar]encoder pyfury.encoder(Foo) foo Foo(f110, f2list(range(1000_000)),f3{fk{i}: i for i in range(1000_000)},f4[Bar(f1fs{i}, f2list(range(10))) for i in range(1000_000)]) binary: bytes encoder.to_row(foo).to_bytes() print(fstart: {datetime.datetime.now()}) foo_row pyfury.RowData(encoder.schema, binary) print(foo_row.f2[100000], foo_row.f4[100000].f1, foo_row.f4[200000].f2[5]) print(fend: {datetime.datetime.now()})binary pickle.dumps(foo) print(fpickle start: {datetime.datetime.now()}) new_foo pickle.loads(binary) print(new_foo.f2[100000], new_foo.f4[100000].f1, new_foo.f4[200000].f2[5]) print(fpickle end: {datetime.datetime.now()}) Java示例 public class Bar {String f1;ListLong f2; }public class Foo {int f1;List Integer f2;Map String, Integer f3;List Bar f4; }Encoder Foo encoder Encoders.rowEncoder(Foo.class); BinaryRow binaryRow encoder.toRow(foo); // 该数据可以被Python零拷贝解析 Foo newFoo encoder.fromRow(binaryRow); // 可以是来自python序列化的数据 BinaryArray binaryArray2 binaryRow.getArray(1); // 零拷贝读取List Integer f2字段 BinaryArray binaryArray4 binaryRow.getArray(4); // 零拷贝读取List Bar f4字段 BinaryRow barStruct binaryArray4.getStruct(10);// 零拷贝读取读取List Bar f4第11个元素数据 // 零拷贝读取读取List Bar f4第11个元素数据的f2字段的第6个元素 long aLong barStruct.getArray(1).getLong(5); Encoder Bar barEncoder Encoders.rowEncoder(Bar.class); // 部分反序列化对象 Bar newBar barEncoder.fromRow(barStruct); Bar newBar2 barEncoder.fromRow(binaryArray4.getStruct(20)); // 对象创建示例 // Foo foo new Foo(); // foo.f1 10; // foo.f2 IntStream.range(0, 1000000).boxed().collect(Collectors.toList()); // foo.f3 IntStream.range(0, 1000000).boxed().collect(Collectors.toMap(i - ki, i-i)); // List Bar bars new ArrayList(1000000); // for (int i 0; i 1000000; i) { // Bar bar new Bar(); // bar.f1 si; // bar.f2 LongStream.range(0, 10).boxed().collect(Collectors.toList()); // bars.add(bar); // } // foo.f4 bars; 自动转换Arrow Fury Format支持自动与Arrow列存互转。 Python示例 import pyfury encoder pyfury.encoder(Foo) encoder.to_arrow_record_batch([foo] * 10000) encoder.to_arrow_table([foo] * 10000) C示例 std::shared_ptr ArrowWriter arrow_writer; EXPECT_TRUE(ArrowWriter::Make(schema, ::arrow::default_memory_pool(), arrow_writer).ok()); for (auto row : rows) {EXPECT_TRUE(arrow_writer-Write(row).ok()); } std::shared_ptr ::arrow::RecordBatch record_batch; EXPECT_TRUE(arrow_writer-Finish(record_batch).ok()); EXPECT_TRUE(record_batch-Validate().ok()); EXPECT_EQ(record_batch-num_columns(), schema-num_fields()); EXPECT_EQ(record_batch-num_rows(), row_nums); Java示例 Schema schema TypeInference.inferSchema(BeanA.class); ArrowWriter arrowWriter ArrowUtils.createArrowWriter(schema); Encoder BeanA encoder Encoders.rowEncoder(BeanA.class); for (int i 0; i 10; i) {BeanA beanA BeanA.createBeanA(2);arrowWriter.write(encoder.toRow(beanA)); } return arrowWriter.finishAsRecordBatch(); 对比其它序列化框架跟其它框架的对比将分为功能、性能和易用性三个维度每个维度上Fury都有比较显著的优势。功能比较这里从10个维度将Fury跟别的框架进行对比每个维度的含义分别为多语言/跨语言是否支持多种语言以及是否支持跨语言序列化自动序列化是否需要写大量序列化代码还是可以完全自动话是否需要schema编译是否需要编写schema IDL文件并编译schema生成代码自定义类型是否支持自定义类型即POJO/DataClass/Struct等非自定义类型是否支持非自定义类型即是否支持直接序列化基本类型、数组、List、Map等还是需要将这些类型包装到自定义类型内部才能进行序列化引用/循环引用对于指向同一个对象的两份引用是否只会序列化数据一次对于循环引用是否能够进行序列化而不是出现递归报错多态子类型对于List/Map的多个子类型如ArrayList/LinkedList/ImmutableListHashMap/LinkedHashMap等反序列化是否能够得到相同的类型还是会变成ArrayList和HashMap反序列化是否需要传入类型即是否需要在反序列化时需要提前知道数据对应的类型。如果需要的话则灵活性和易用性会受到限制而且传入的类型不正确的话反序列化可能会crash部分反序列化/随机读写反序列化是否可以只读取部分字段或者嵌套的部分字段对于大对象这可以节省大量序列化开销堆外内存读写即是否支持直接读写native内存数值类型可空是否支持基本类型为null比如Java的Integer等装箱类型以及python的int/float可能为null。性能比较(数值越小越好) 这里给出在纯Java序列化场景对比其它框架的性能测试结果。其它语言的性能测试将在后续文章当中发布。测试环境操作系统4.9.151-015.ali3000.alios7.x86_64CPU型号Intel(R) Xeon(R) Platinum 8163 CPU 2.50GHzByte OrderLittle EndianL1d cache32KL1i cache32KL2 cache1024KL3 cache33792K 测试原则自定义类型序列化测试数据使用的是kryo-benchmark[8]的数据保证测试结果对Fury没有任何偏向性。尽管Kryo测试数据里面有大量基本类型数组为了保证测试的公平性我们并没有开启Fury的Out-Of-Band零拷贝序列化能力。然后使用我们自己创建的对象单独准备了一组零拷贝测试用例。测试工具为了避免JVM JIT给测试带来的影响我们使用JMH[9]工具进行测试每组测试在五个子进程依次进行避免受到进程CPU调度的影响同时每个进程里面执行三组Warmup和5组正式测试避免受到偶然的环境波动影响。下面是我们使用JMH测试fury/kryo/fst/hession/protostuff/jdk序列化框架在序列化到堆内存和堆外内存时的性能(数值越小越好)。自定义类型性能对比 Struct Struct类型主要是有纯基本类型的字段组成对于这类对象Fury通过JIT等技术可以达到Kryo 20倍的性能。 public class Struct implements Serializable {int f1;long f2;float f3;double f4;...int f97;long f98;float f99;double f100; } 序列化反序列化 Sample Sample类型主要由基本类型、装箱类型、字符串和数组等类型字段组成对于这种类型的对象Fury的性能可以达到Kryo的6~7倍。没有更快的原因是因为这里的多个基本类型数组需要进行拷贝这块占用一定的耗时。如果使用Fury的Out-Of-Band序列化的话。这些额外的拷贝就可以完全避免掉但这样比较不太公平因此这里没有开启。 public final class Sample implements Serializable {public int intValue;public long longValue;public float floatValue;public double doubleValue;public short shortValue;public char charValue;public boolean booleanValue;public Integer IntValue;public Long LongValue;public Float FloatValue;public Double DoubleValue;public Short ShortValue;public Character CharValue;public Boolean BooleanValue;public int[] intArray;public long[] longArray;public float[] floatArray;public double[] doubleArray;public short[] shortArray;public char[] charArray;public boolean[] booleanArray;public String string; // Can be null.public Sample sample; // Can be null.public Sample() {}public Sample populate(boolean circularReference) {intValue 123;longValue 1230000;floatValue 12.345f;doubleValue 1.234567;shortValue 12345;charValue !;booleanValue true;IntValue 321;LongValue 3210000L;FloatValue 54.321f;DoubleValue 7.654321;ShortValue 32100;CharValue $;BooleanValue Boolean.FALSE;intArray new int[] {-1234, -123, -12, -1, 0, 1, 12, 123, 1234};longArray new long[] {-123400, -12300, -1200, -100, 0, 100, 1200, 12300, 123400};floatArray new float[] {-12.34f, -12.3f, -12, -1, 0, 1, 12, 12.3f, 12.34f};doubleArray new double[] {-1.234, -1.23, -12, -1, 0, 1, 12, 1.23, 1.234};shortArray new short[] {-1234, -123, -12, -1, 0, 1, 12, 123, 1234};charArray asdfASDF.toCharArray();booleanArray new boolean[] {true, false, false, true};string ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789;if (circularReference) {sample this;}return this;} } 序列化耗时反序列化耗时 MediaContent 对于MediaContent这类包含大量String的数据结构Fury性能大概是Kryo的4~5倍。没有更快的原因是因为String序列化开销比较大部分摊平了Fury JIT带来的性能提升。用户如果对String序列化有更好的性能要求的话可以使用Fury的String零拷贝序列化协议在序列化时直接把String内部的Buffer抽取出来然后直接放到Out-Of-Band buffer里面完全避免掉String序列化的开销。 public final class Media implements java.io.Serializable {public String uri;public String title; // Can be null.public int width;public int height;public String format;public long duration;public long size;public int bitrate;public boolean hasBitrate;public List String persons;public Player player;public String copyright; // Can be null.public Media() {}public enum Player {JAVA,FLASH;} } public final class MediaContent implements java.io.Serializable {public Media media;public List Image images;public MediaContent() {}public MediaContent(Media media, List Image images) {this.media media;this.images images;} public MediaContent populate(boolean circularReference) {media new Media();media.uri http://javaone.com/keynote.ogg;media.width 641;media.height 481;media.format video/theora\u1234;media.duration 18000001;media.size 58982401;media.persons new ArrayList();media.persons.add(Bill Gates, Jr.);media.persons.add(Steven Jobs);media.player Media.Player.FLASH;media.copyright Copyright (c) 2009, Scooby Dooby Doo;images new ArrayList();Media media circularReference ? this.media : null;images.add(new Image(http://javaone.com/keynote_huge.jpg,Javaone Keynote\u1234,32000,24000,Image.Size.LARGE,media));images.add(new Image(http://javaone.com/keynote_large.jpg, null, 1024, 768, Image.Size.LARGE, media));images.add(new Image(http://javaone.com/keynote_small.jpg, null, 320, 240, Image.Size.SMALL, media));return this;} } 序列化耗时反序列化耗时 Buffer零拷贝性能对比基本类型数组对于基本类型可以看到Fury序列化几乎耗时为0而别的框架耗时随着数组大小线性增加。反序列时Fury耗时也会线性增加是因为需要把Buffer拷贝到Java基本类型数组里面。 public class ArraysData implements Serializable {public boolean[] booleans;public byte[] bytes;public int[] ints;public long[] longs;public double[] doubles;public ArraysData() {}public ArraysData(int arrLength) {booleans new boolean[arrLength];bytes new byte[arrLength];ints new int[arrLength];longs new long[arrLength];doubles new double[arrLength];Random random new Random();random.nextBytes(bytes);for (int i 0; i arrLength; i) {booleans[i] random.nextBoolean();ints[i] random.nextInt();longs[i] random.nextLong();doubles[i] random.nextDouble();}} } 序列化耗时反序列耗时堆外Buffer 除了基本类型数组我们也测试了Java ByteBuffer的序列化性能。由于Kryo和Fst并不支持ByteBuffer序列化同时并没有提供直接读写ByteBuffer的接口因此我们使用了byte array来模拟内存拷贝。可以看到对于堆外BufferFury的序列化和反序列化耗时都是一个常量不随Buffer大小而增加。序列化耗时反序列化耗时易用性比较这里以一个自定义类型为例对比易用性该类型包含常见基本类型字段以及集合类型字段最终需要序列化的对象是一个Bar的实例 class Foo {String f1;Map String, Integer f2; } class Bar {Foo f1;String f2;List Foo f3;Map Integer, Foo f4;Integer f5;Long f6;Float f7;Double f8;short[] f9;List Long f10; } Fury序列化 Fury序列化只需一行代码且无任何学习成本。 Fury fury Fury.builder().withLanguage(Language.XLANG).build(); byte[] data fury.serialize(bar); // 这里的data可以是被Fury python/Golang实现序列化的数据 Bar newBar fury.deserialize(data); 对比Protobuf 首先需要安装protoc编译器[10]注意protoc的版本不能高于proto依赖库的版本然后定义针对需要序列化的对象的schema syntax proto3; package protobuf;option java_package io.ray.fury.benchmark.state.generated; option java_outer_classname ProtoMessage;message Foo {optional string f1 1;map string, int32 f2 2; }message Bar {optional Foo f1 1;optional string f2 2;repeated Foo f3 3;map int32, Foo f4 4;optional int32 f5 5;optional int64 f6 6;optional float f7 7;optional double f8 8;repeated int32 f9 9; // proto不支持int16repeated int64 f10 10; } 然后通过protoc编译schema生成Java/Python/GoLang代码文件。 java: protoc --experimental_allow_proto3_optional -Isrc/main/java/io/ray/fury/benchmark/state --java_outsrc/main/java/ bench.protobench.proto生成Python/GoLang代码为了避免把生成的代码提交到代码仓库需要将proto跟构建工具进行集成这块较为复杂存在大量构建工具集成成本。且由于构建工具的不完善这部分依然无法完全自动化比如protobuf-maven-plugin[11]依然需要用户在机器安装protoc而不是自动下载protoc。由于大部分场景都是用户已经有了自定义类型和基本类型以及组合类型构成的对象(树)需要被序列化因此需要将用户类型对象转换成protobuf格式。这里面就有较大的开发成本且每种需要都需要写一遍代码冗长且易出错难维护同时还存在大量数据转换和拷贝开销。另外转换过程没有考虑实际类型因此还存在类型丢失的问题比如LinkedList反序列化回来变成了ArrayList。下面是Java的序列化代码大概需要130~150行。 return build(bar).build().toByteArray(); }public static ProtoMessage.Bar.Builder build(Bar bar) {ProtoMessage.Bar.Builder barBuilder ProtoMessage.Bar.newBuilder();if (bar.f1 null) {barBuilder.clearF1();} else {barBuilder.setF1(buildFoo(bar.f1));}if (bar.f2 null) {barBuilder.clearF2();} else {barBuilder.setF2(bar.f2);}if (bar.f3 null) {barBuilder.clearF3();} else {for (Foo foo : bar.f3) {barBuilder.addF3(buildFoo(foo));}}if (bar.f4 null) {barBuilder.clearF4();} else {bar.f4.forEach((k, v) - {ProtoMessage.Foo.Builder fooBuilder1 ProtoMessage.Foo.newBuilder();fooBuilder1.setF1(v.f1);v.f2.forEach(fooBuilder1::putF2);barBuilder.putF4(k, fooBuilder1.build());});}if (bar.f5 null) {barBuilder.clearF5();} else {barBuilder.setF5(bar.f5);}if (bar.f6 null) {barBuilder.clearF6();} else {barBuilder.setF6(bar.f6);}if (bar.f7 null) {barBuilder.clearF7();} else {barBuilder.setF7(bar.f7);}if (bar.f8 null) {barBuilder.clearF8();} else {barBuilder.setF8(bar.f8);}if (bar.f9 null) {barBuilder.clearF9();} else {for (short i : bar.f9) {barBuilder.addF9(i);}}if (bar.f10 null) {barBuilder.clearF10();} else {barBuilder.addAllF10(bar.f10);}return barBuilder; }public static ProtoMessage.Foo.Builder buildFoo(Foo foo) {ProtoMessage.Foo.Builder builder ProtoMessage.Foo.newBuilder();if (foo.f1 null) {builder.clearF1();} else {builder.setF1(foo.f1);}if (foo.f2 null) {builder.clearF2();} else {foo.f2.forEach(builder::putF2);}return builder; }public static Foo fromFooBuilder(ProtoMessage.Foo.Builder builder) {Foo foo new Foo();if (builder.hasF1()) {foo.f1 builder.getF1();}foo.f2 builder.getF2Map();return foo; }public static Bar deserializeBar(byte[] bytes) throws InvalidProtocolBufferException {Bar bar new Bar();ProtoMessage.Bar.Builder barBuilder ProtoMessage.Bar.newBuilder();barBuilder.mergeFrom(bytes);if (barBuilder.hasF1()) {bar.f1 fromFooBuilder(barBuilder.getF1Builder());}if (barBuilder.hasF2()) {bar.f2 barBuilder.getF2();}bar.f3 barBuilder.getF3BuilderList().stream().map(ProtoState::fromFooBuilder).collect(Collectors.toList());bar.f4 new HashMap();barBuilder.getF4Map().forEach((k, v) - bar.f4.put(k, fromFooBuilder(v.toBuilder())));if (barBuilder.hasF5()) {bar.f5 barBuilder.getF5();}if (barBuilder.hasF6()) {bar.f6 barBuilder.getF6();}if (barBuilder.hasF7()) {bar.f7 barBuilder.getF7();}if (barBuilder.hasF8()) {bar.f8 barBuilder.getF8();}bar.f9 new short[barBuilder.getF9Count()];for (int i 0; i barBuilder.getF9Count(); i) {bar.f9[i] (short) barBuilder.getF9(i);}bar.f10 barBuilder.getF10List();return bar; } Python序列化代码大概130~150行 GoLang序列化代码大概130~150行即使之前没有针对该数据的自定义类型也无法将protobuf生成的class直接用在业务代码里面。因为protobuf生成的class并不符合面向对象设计[12]无法给生成的class添加行为。这时候就需要定义额外的wrapper如果自动内部有其它自定义类型还需要将这些类型转换成对应的wrapper这进一步限制了使用的灵活性。对比Flatbuffer Flatbuffer与protobuf一样也需要大量的学习成本和开发成本安装flatc编译器[13]对于Linux环境可能还需要进行源码编译安装flatc。定义Schema namespace io.ray.fury.benchmark.state.generated;table FBSFoo {string:string;f2_key:[string]; // flatbuffers不支持mapf2_value:[int]; }table FBSBar {f1:FBSFoo;f2:string;f3:[FBSFoo];f4_key:[int]; // flatbuffers不支持mapf4_value:[FBSFoo];f5:int;f6:long;f7:float;f8:double;f9:[short];f10:[long];// 由于fbs不支持基本类型nullable因此还需要单独一组字段或者一个vector标识这些值是否为null }root_type FBSBar; 然后通过flatc编译schema生成Java/Python/GoLang代码文件。 java: flatc -Isrc/main/java/io/ray/fury/benchmark/state -osrc/main/java/ bar.fbs生成Python/GoLang代码为了避免把生成的代码提交到代码仓库需要将proto跟构建工具进行集成目前似乎只有bazel构建工具有比较好的集成别的构建工具如maven/gradle等似乎都没有比较好的集成方式。因为生成的类不符合面向对象设计无法直接添加行为同时已有系统里面已经有了需要被序列化的类型因此也需要将已有类型的对象序列化成flatbuffer格式。Flatbuffer序列化代码不仅存在和Protobuf一样代码冗长易出错难维护问题还存在以下问题代码不灵活、难写且易出错。由于flatbuffer在序列化对象树时需要先深度优先和先序遍历整颗对象树并手动保存每个变长字段的offset到临时状态然后再序列化所有字段偏移或者内联标量值这块代码写起来非常繁琐一旦offset存储出现错误序列化将会出现assert/exception/panic等报错较难排查。list元素需要按照反向顺序进行序列化不符合直觉。由于buffer是从后往前构建因此对于list需要将元素逆向依次进行序列化。不支持map类型需要将map序列化为两个list或者序列化为一个table进一步带来了额外的开发成本。下面是Java的序列化代码大概需要100~150行处理每个字段是否为null大概还需要100行左右代码。因此Java序列化大概需要200~250行代码 public static byte[] serialize(Bar bar) {return buildBar(bar).sizedByteArray(); }public static FlatBufferBuilder buildBar(Bar bar) {// 这里忽略了空值处理的代码FlatBufferBuilder builder new FlatBufferBuilder();int f2_offset builder.createString(bar.f2);int[] f3_offsets new int[bar.f3.size()];for (int i 0; i bar.f3.size(); i) {f3_offsets[i] buildFoo(builder, bar.f3.get(i));}int f3_offset FBSBar.createF3Vector(builder, f3_offsets);int f4_key_offset;int f4_value_offset;{int[] keys new int[bar.f4.size()];int[] valueOffsets new int[bar.f4.size()];int i 0;for (Map.Entry Integer, Foo entry : bar.f4.entrySet()) {keys[i] entry.getKey();valueOffsets[i] buildFoo(builder, entry.getValue());i;}f4_key_offset FBSBar.createF4KeyVector(builder, keys);f4_value_offset FBSBar.createF4ValueVector(builder, valueOffsets);}int f9_offset FBSBar.createF9Vector(builder, bar.f9);int f10_offset FBSBar.createF10Vector(builder, bar.f10.stream().mapToLong(x - x).toArray());FBSBar.startFBSBar(builder);FBSBar.addF1(builder, buildFoo(builder, bar.f1));FBSBar.addF2(builder, f2_offset);FBSBar.addF3(builder, f3_offset);FBSBar.addF4Key(builder, f4_key_offset);FBSBar.addF4Value(builder, f4_value_offset);FBSBar.addF5(builder, bar.f5);FBSBar.addF6(builder, bar.f6);FBSBar.addF7(builder, bar.f7);FBSBar.addF8(builder, bar.f8);FBSBar.addF9(builder, f9_offset);FBSBar.addF10(builder, f10_offset);builder.finish(FBSBar.endFBSBar(builder));return builder; }public static int buildFoo(FlatBufferBuilder builder, Foo foo) {int stringOffset builder.createString(foo.f1);int[] keyOffsets new int[foo.f2.size()];int[] values new int[foo.f2.size()];int i 0;for (Map.Entry String, Integer entry : foo.f2.entrySet()) {keyOffsets[i] builder.createString(entry.getKey());values[i] entry.getValue();i;}int keyOffset FBSFoo.createF2KeyVector(builder, keyOffsets);int f2ValueOffset FBSFoo.createF2ValueVector(builder, values);return FBSFoo.createFBSFoo(builder, stringOffset, keyOffset, f2ValueOffset); }public static Bar deserializeBar(ByteBuffer buffer) {Bar bar new Bar();FBSBar fbsBar FBSBar.getRootAsFBSBar(buffer);bar.f1 deserializeFoo(fbsBar.f1());bar.f2 fbsBar.f2();{ArrayList Foo f3List new ArrayList();for (int i 0; i fbsBar.f3Length(); i) {f3List.add(deserializeFoo(fbsBar.f3(i)));}bar.f3 f3List;}{Map Integer, Foo f4 new HashMap();for (int i 0; i fbsBar.f4KeyLength(); i) {f4.put(fbsBar.f4Key(i), deserializeFoo(fbsBar.f4Value(i)));}bar.f4 f4;}bar.f5 fbsBar.f5();bar.f6 fbsBar.f6();bar.f7 fbsBar.f7();bar.f8 fbsBar.f8();{short[] f9 new short[fbsBar.f9Length()];for (int i 0; i fbsBar.f9Length(); i) {f9[i] fbsBar.f9(i);}bar.f9 f9;}{List Long f10 new ArrayList();for (int i 0; i fbsBar.f10Length(); i) {f10.add(fbsBar.f10(i));}bar.f10 f10;}return bar; }public static Foo deserializeFoo(FBSFoo fbsFoo) {Foo foo new Foo();foo.f1 fbsFoo.string();HashMap String, Integer map new HashMap();foo.f2 map;for (int i 0; i fbsFoo.f2KeyLength(); i) {map.put(fbsFoo.f2Key(i), fbsFoo.f2Value(i));}return foo; } Python序列化代码大概200~250行 GoLang序列化代码大概200~250行将Flatbuffer生成类型包装到其它符合面向对象设计的类里面由于Flatbuffer序列化过程需要保存大量中间offset且需要先把所有可变长度对象写入buffer因此通过wrapper修改flatbuffer数据会比较复杂使得包装Flatbuffer生成类型只适合反序列化读数据过程导致添加wrapper也变得很困难。对比Msgpack Msgpack Java和Python并不支持自定义类型序列化需要用户增加扩展类型手动进行序列化因此这里省略。总结 Fury最早是我在2019年开发当时是为了支持分布式计算框架Ray[14]的跨语言序列化以及蚂蚁在线学习场景样本流的跨语言传输问题。经过蚂蚁丰富业务场景的打磨目前已经在蚂蚁在线学习、运筹优化、Serving等多个计算场景稳定运行多年。总体来看Fury主要优势主要是跨语言原生序列化大幅提高了跨语言序列化的易用性降低研发成本通过JIT技术来优化序列化性能。这里也可以看到通过把数据库和大数据领域的代码生成思想用在序列化上面是一个很好的思路可以取得非常显著的性能提升Zero-Copy序列化避免所有不必要的内存拷贝多语言行存支持避免序列化和元数据开销未来我们会在协议、框架和生态三个方面继续优化协议层面 JIT代码生成支持数据压缩模式进一步通过SIMD向量化指令进行大规模数据压缩框架层面更多Java序列化代码JIT化完善C支持通过使用Macro、模板和编译时反射在编译时注册捕获Fury需要的类型信息实现自动C序列化通过Golang-ASM支持基于JIT的Golang序列化实现通过将更多Python代码Cython化来进一步加速Python序列化支持JavaScript打通NodeJS生态支持Rust生态层面与RPC框架SOFA、Dubbo、Akka等集成与分布式计算框架Spark和Flink等集成多语言的支持与生态建设是一项复杂的工作接下来我们会尽快开源Fury吸引感兴趣的同学一起参与进来。如果有开源使用场景或者合作意向欢迎通过邮箱chaokun.yckantgroup.com 交流。参考链接 [1]https://github.com/EsotericSoftware/kryo [2]https://spark.apache.org/docs/latest/index.html [3]https://flink.apache.org/ [4]https://databricks.com/blog/2015/04/28/project-tungsten-bringing-spark-closer-to-bare-metal.html [5]https://arrow.apache.org/ [6]https://developers.google.com/protocol-buffers/docs/javatutorial#parsing-and-serialization [7]https://peps.python.org/pep-0574 [8]https://github.com/EsotericSoftware/kryo/tree/master/benchmarks [9]https://openjdk.org/projects/code-tools/jmh/ [10]https://developers.google.com/protocol-buffers/docs/downloads [11]https://www.xolstice.org/protobuf-maven-plugin/usage.html [12]https://developers.google.com/protocol-buffers/docs/javatutorial#parsing-and-serialization [13]https://github.com/google/flatbuffers/releases [14]https://github.com/ray-project/ray 作者 | 杨朝坤(慕白) 原文链接本文为阿里云原创内容未经允许不得转载。

查看全文

http://www.pierceye.com/news/189607/